HTML в Internet
Страница 5
Рис. 1 Страны, обозначенные черным цветом, имеют связь по Internet. Число людей, имеющих такой доступ, в этих странах становится все больше и больше. Страны, обозначенные белым цветом могут работать по email, в локальных сетях или не имеют ничего подобного вообще. Статистика на1994г.
2.1. Немного истории
История WWW - Мировой Информационной Паутины началась в Марте 1989, когда Tim Berners-Lee из Европейской Лаборатории Физики Элементарных Частиц (известной как CERN), где работал коллектив исследователей-физиков, предложил новый способ обмена результатами исследований и идеями между организациями. Такой обмен был очень необходим, потому что члены этой организации работали в разных странах.
Предлагалось использовать просто систему гипертекста для передачи документов и установления связи между членами общества физиков - ядерщиков. Тогда еще не было планов задействования звука или видео, и не рассматривалась возможность передачи изображения.
К концу 1990, впервые программное обеспечение WWW было установлено на ЭВМ NeXT. Теперь можно было просматривать и передавать документы гипертекста другим людям через Internet, а также появилась возможность редактировать документы гипер-текста прямо на экране компьютера. Программа сначала демонстрировалась перед члена-ми общества и на семинарах в CERN'е, а затем была показана на конференции «Гипер-текст'91».
До 1992 Tim продолжал выступать со своим проектом, до тех пор пока не появились желающие продолжить работу над этой проблемой.
Сотни людей со всего мира приняли участие в разработке этого проекта, одни писа-ли программы и документы для WWW, другие просто рассказывали людям о WWW. Груп-па пионеров-проектировщиков WWW даже не могла предполагать тогда, что начатое ими дело достигнет таких масштабов. Только за первых четыре месяца 1994 о WWW говорили и писали CNN, «Wall Street Journal», «Economist», «Fortune», «New York Times» и многие компьютерные издания.
2.2. Что такое WWW?
Так что же такое World Wide Web, или, как говорят в просторечье, WWW, the Web, или еще проще - 3W? WWW - это распределенная информационная система мультимедиа, основанная на гипертексте. Давайте разберем это определение по порядку.
Распределенная информационная система: информация хранится на огромном множестве так называемых WWW-серверов (servers). То есть компьютеров, на которых установлено специальное программное обеспечение и которые объединены в сеть Internet. Пользователи, имеющие доступ к сети, получают эту информацию при помощи программ-клиентов, называемых программами просмотра WWW-документов. При этом программа просмотра посылает по компьютерной сети запрос серверу, хранящему файл с необходи-мым документом. В ответ на запрос сервер высылает программе просмотра этот требуе-мый файл или сообщение об отказе, если файл по тем или иным причинам недоступен. Взаимодействие клиент-сервер происходит по определенным правилам, или, как говорят иначе, протоколу. Протокол, принятый в WWW, называется HyperText Transfer Protocol, сокращенно - HTTP.
Мультимедиа: информация включает в себя не только текст, но и двух- и трехмерную графику, видео и звук.
Гипертекст: информация в WWW представляется в виде документов, каждый из которых может содержать как внутренние перекрестные ссылки, так и ссылки на другие документы, хранящиеся на том же самом или на любом другом сервере.
Такие ссылки называют гиперссылками или гиперсвязями. На экране компьютера в окне программы просмотра ссылки выглядят как выделенные каким-либо образом (напри-мер, другим цветом и/или подчеркиванием) участки текста или графики. Выбирая гипер-ссылки, пользователь программы просмотра может быстро перемещаться от одной части документа к другой, или же от одного документа к другому. При необходимости программа просмотра автоматически связывается с соответствующим сервером в сети и запрашивает документ, на который сделана ссылка. Кстати, идея гипертекстового представления информации должна уже быть хорошо знакома пользователям различных версий системы Microsoft Windows, каковых среди читателей этой книги, вероятно, большинство. Именно по этому принципу построена в Windows система подсказок (Help), с той лишь разницей, что гипертекстовая система подсказок Windows не является распределенной.
Итак, WWW-документ может содержать стилизованный и форматированный текст, графику и гиперсвязи с различными ресурсами Internet. Чтобы реализовать все эти возмож-ности, был разработан специальный язык, названный HyperText Markup Language (HTML), то есть, Язык Разметки Гипертекста. Документ, написанный на HTML, представляет собой текстовый файл, содержащий собственно текст, несущий информацию читателю, и флаги разметки. Последние представляют собой определенные стандартом HTML последова-тельности символов, являющиеся инструкциями для программы просмотра; согласно этим инструкциям программа располагает текст на экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и формирует гиперсвязи с другими документами или ресурсами Internet. Таким образом, файл на языке HTML приобретает облик WWW-доку-мента только тогда, когда он интерпретируется программой просмотра. О языке HTML мы подробно расскажем в соответствующих разделах книги, поскольку без знания основ этого языка невозможно создать свой собственный гипертекст для публикации в WWW.
2.3. Как в WWW задается местонахождение документа?
Виртуальный мир WWW населен миллионами документов, обитающих на сотнях тысяч серверов. Задача WWW-путешественника - найти среди них тот, который содержит необходимую информацию, и прочитать его при помощи программы просмотра, - а для этого программа просмотра должна знать точное местонахождение данного документа. Оно однозначно определяется адресом сервера, номером порта, именем директории и именем файла с этим документом. Для успешной загрузки требуемого документа сервера программе просмотра также нужно указать протокол, используемый этим сервером. Это связано с тем, то кроме WWW-серверов, программы просмотра могут обращаться к серве-рам пересылки файлов (так называемым FTP-серверам), серверам телеконференций, серве-рам электронной почты и некоторым другим типам серверов. Комбинация протокола, адреса сервера, номера порта, имени директории и имени файла получила название Uniform Resource Locator, или сокращенно URL. Синтаксис URL показан ниже:
протокол://адрес_сервера:номер_порта/имя_директории/имя_файла
Протокол, как уже было сказано выше, это совокупность правил, по которым происходит взаимодействие клиент-сервер. Мы уже знаем, что «родной» протокол WWW называется http. Кроме http, WWW-клиенты могут общаться с серверами, поддерживающи-ми протоколы ftp, gopher и некоторыми другими, на которых я здесь останавливаться не буду, а расскажу о них далее.
Название протокола отделяется от остальной части URL двоеточием. В названии протокола прописные латинские буквы и соответствующие им строчные буквы эквива-лентны.
Начало адреса отмечается двумя косыми чер-тами // Он состоит из нескольких частей - так называемых поддоменов. Поддомены, представляющие собой сочетания букв и цифр, разделяются точками, причем, «уточнение координат адресата» от более крупных к более мелким поддоменам происходит справа налево. Так же как и в названии протокола, в адресе сервера прописные латинские буквы и соответствующие им строчные буквы эквивалентны.
Номер порта выражается целым положительным числом и отделяется от адреса двоеточием. Порт - это как бы «дверь», через которую можно зайти в сервер. Сервер может иметь несколько доступных портов; если номер порта WWW-сервера равен 80, то в URL его можно не указывать.
Файлы с документами, публикуемыми в WWW, часто имеют суффиксы .html или .htm. Эти суффиксы являются аббревиатурой от названия языка, на котором пишут WWW-доку-менты, HyperText Markup Language, о котором будет подробно рассказано далее.
Если имя директории начинается с символа ~ (тильда), это означает, что это - так называемая домашняя директория (home directory) пользователя данной компьютерной системы. На компьютерах с многопользовательской операционной системой UNIX каждо-му пользователю присваивается имя пользователя, под которым он регистрируется в сис-теме, и выделяется собственная «домашняя» директория, предназначенная для хранения принадлежащих ему файлов. Имя домашней директории совпадает с именем пользователя. Вместо абсолютного имени домашней директории с указанием всех ее поддиректорий можно использовать имя пользователя, которому предшествует символ ~ (тильда).