Обмен мнениями
Вернувшись к работе после долгого отпуска, я всегда особенно ценю средства управления информацией. От долгого лежания на пляже мои способности фильтровать информацию несколько притупляются, и неразобранная груда сообщений электронной, голосовой и обычной почты действует на меня просто устрашающе.
Однако чем информация структурированнее, тем легче ее фильтровать. Например, простой сортировкой по отправителю, дате и тому, было ли сообщение направлено лично мне или разослано по списку, удается всего за полдня среди 500 сообщений электронной почты обнаружить 70 действительно ценных. Даже у голосовых посланий есть своя структура, налагаемая почтовой системой, которая позволяет расположить сообщения в обратном порядке (самые свежие - первыми).
Хуже всего поддаются сортировке бумажные письма и кипы периодики. В конце недели я выбрасываю многие такие послания даже не распечатывая. То, что действительно важно, пришлют еще раз.
Большинство Web-страниц представляют собой такую же неструктурированную свалку, как и горы бумажной почты. Поэтому фильтровать данные, извлекать нужные сведения и находить нужную страницу очень трудно. XML (Extensible Markup Language - расширенный язык разметки) - это попытка предоставить разработчикам Web-страниц средства структуризации. Он позволяет издателям создавать расширения HTML или задавать новые языки разметки, которые описывают данные более исчерпывающе и так, чтобы они поддавались автоматизированной проверке и импортированию.
В небольших масштабах это уже реализовано. Созданный корпорацией Microsoft язык CDF (Channel Definition Format - язык описания канала) является одним из первых XML-языков и позволяет сгенерировать облегчающую навигацию древовидную тематическую структуру узла. На подходе и более сложные разработки на базе XML. Одна из них, например, использует XML для организации электронного обмена данными (см. www.geocities.com/ WallStreet/Floor/ 5815). Появляются и новые XML-инструменты.
Использовать языки и форматы, разработанные на базе XML, нетрудно, сложнее применить XML для структурирования своего собственного узла. Проще всего воспользоваться уже готовым XML-языком, типа CDF, но для многих узлов понадобится нечто большее. Обмен информацией непосредственно между двумя организациями, например обеспечение партнерам регулярного доступа к вашему прайс-листу, потребует, вероятно, выработки специальных тегов или даже нового языка разметки, ориентированного на вашу конкретную отрасль или сферу бизнеса.
Пора бы задуматься, как должен выглядеть ваш язык разметки. Какая информация действительно интересует вашу аудиторию? Если ваш узел формируется частично на основе базы данных, то у вас есть все предпосылки для создания того, что называется DTD (Document Type Definition - определение типа документа), т. е. описания XML-языка, связанного со структурой конкретной БД.
Особую ценность XML-языку придает то, что при его использовании не придется упрощать информацию своей БД, заталкивая ее в прокрустово ложе HTML-тегов. Вы можете создать такое DTD-описание, которое определяет каждое поле в вашей БД, что позволит сразу же публиковать эту информацию на Web-узле.
Однако создать такое описание непросто. Хотя XML значительно легче, чем стандартный язык обобщенной разметки SGML (описание рабочей версии XML занимает всего 33 страницы против 500 страниц описания SGML), его структура довольно запутанна. Уже начали появляться синтаксические анализаторы и даже вьюверы для XML, но прежде всего нужны более простые средства создания DTD.
Рискуя показаться излишне высокопарным, я не считаю преувеличением сказать, что XML “перевернет” Web. Он достаточно надежен, чтобы передать практически любой документ без существенных потерь его характеристик и информации, которые неизбежны при переходе к HTML.
А все, что позволит нам придать хоть чуточку смысла горам имеющейся в Web информации, - это здорово.
Имонн Салливан
Вы собираетесь использовать XML?
Сообщите мне об этом по адресу: esullivan@zd.com.