Целью Resource Description Framework, стандарта, предложенного недавно консорциумом World Wide Web (W3C), является наведение некоторого порядка в дебрях Web.
Три буквы RDF могут заменить добрую половину алфавита, задействованную в названиях предлагаемых сегодня Web-языков, таких, как CDF (Channel Definition Format - формат описания канала), OSD (Open Software Description - открытый формат описания ПО) и PICS (Platform for Internet Content Selection - платформа для отбора содержания Internet). RDF может использоваться также в качестве основы для создания более совершенных программ управления документами и поисковых механизмов.
Информация об информации
RDF представляет собой спецификацию метаданных, т. е. информации об информации. Метаданными о документе или книге могут быть, например, заголовок, имя автора, выходные данные, тематика и даже оглавление и предметный указатель.
Реже встречаются такие метаданные, как ссылки на обзоры и рецензии, в которых упоминается документ, рейтинги его содержания (например, определяющие, насколько он подходит для детской аудитории) и подписи или печати, заверяющие его аутентичность.
Граница, отделяющая метаданные от данных, очень зыбка. Метаданные сами могут выступать в роли данных и описываться другими метаданными. Примером этого являются, скажем, выходные данные библиографического каталога.
Концепция метаданных не нова, однако в постоянно меняющемся мире Web воспользоваться ею непросто, ведь каждая заинтересованная группа предлагает свой частный подход. Так, для формализации уровня пристойности Web-содержания была создана спецификация PICS, а CDF предназначается для хранения метаданных, которые необходимы для систем автоматической доставки (push) информации.
Широко распространен так называемый стандарт Dublin Core - метод, применяемый для составления “библиотечных каталогов”, содержащих имена авторов, номера предметных классификаций и т. д. Он предполагает использование HTML-тега Meta, под который помещается краткий список категорий или атрибутов (например, одним из элементов Dublin Core является атрибут “Автор”).
RDF несколько приподнимается над этой конкретикой и претендует на то, чтобы стать подходом, способным решить все перечисленные задачи, а также многие другие.
Быстрее всего RDF может быть поддержан создателями систем поиска информации в Web. Предварительный отбор только тех документов, которые были созданы определенными авторами или имеют определенную тематику, способен значительно повысить эффективность полнотекстового поиска.
Например, при полнотекстовом поиске по слову “patriots” сужение области поиска до страниц, посвященных спорту, повышает вероятность нахождения документов, в которых речь идет о футбольной команде с этим названием, а не о Джоне Квинси Адамсе (шестой президент США. - Прим. перев.).
Кроме того, RDF даст конечному пользователю возможность формирования своего персонального способа просмотра Web. Поддерживающий RDF браузер сможет, как представляется, “на лету” переупорядочивать материалы Web-узлов, “поднимая на поверхность” ту информацию, которая с большей вероятностью представляет ценность для пользователя.
Хотя в текущем варианте проекта это не отражено, RDF может использоваться также в качестве основы для организации обмена информацией между фирмами и индивидуальными пользователями. Развернутые во времени графики, персональные предпочтения, информация системы обеспечения безопасности - все это примеры данных, которые оказываются более полезны, если сопровождаются метаданными.
Первый проект был размещен в октябре в Web по адресу: www.w3.org/ Metadata/RDF/. Эта публикация стала первым шагом на пути к стандартизации RDF - процесса, который может занять несколько месяцев и увенчаться в итоге принятием рекомендации W3C.
Однако в отличие от большинства других проектов, подготовленных W3C, текущая спецификация непригодна для непосредственного применения. Прежде чем разработчики смогут приступить к реализации RDF в своих продуктах, необходимо еще опубликовать важнейший компонент этой спецификации - метод создания RDF-схем. Текущий документ лишь позволяет разработчикам получить представление о потенциальных возможностях нового языка и приступить к первоначальному планированию приложений. Пока еще RDF находится на самом сложном и опасном этапе своего развития.
Одна из опасностей на пути к стандартизации RDF - конкуренция между корпорациями Netscape Communications и Microsoft. Хотя текущий вариант спецификации еще далек от окончательного, Netscape и Microsoft уже внедряют свои собственные схемы, основанные на предложениях, представленных ими в рабочую группу по RDF. Netscape, например, уже продемонстрировала использующее RDF клиентское приложение под рабочим названием Aurora.
Однако RDF в интерпретации Microsoft и Netscape - только похожи, но отнюдь не совместимы. Осмотрительным разработчикам и составителям документов придется подождать, пока W3C опубликует более полную спецификацию.
Еще один язык, ведущий происхождение от XML
Подобно CDF и OSD, RDF является расширением XML (Extensible Markup Language - расширяемый язык разметки), т. е. был создан на его основе. RDF не является заменой XML - его можно рассматривать как переходную ступень между XML и некоторыми приложениями.
Возможно, это определение покажется вам несколько путаным - что ж, таково оно на самом деле и есть. На практике это означает, что, будучи полностью определен, RDF должен упростить создание языков описания метаданных. Например, если вам нужна схема метаданных для использования в процессе производства и распространения элементов пользовательского интерфейса ПО, применение RDF, вероятно, окажется более простым вариантом по сравнению с созданием совершенно нового языка непосредственно на базе XML.
Чтобы определить формат метаданных с применением RDF, необходимо прежде всего составить его схему. RDF-схема аналогична схеме БД, только вместо полей данных и диапазонов допустимых для них значений в RDF-схеме определяются атрибуты (такие, как “Автор” и “Дата_публикации”) и типы их допустимых значений (имена и даты соответственно).
После того как схема составлена, разработчик может переходить к RDF-утверждениям. Каждое такое утверждение состоит из трех частей: документ, атрибут и значение. В роли документа обычно выступает Web-страница или ее адрес. Примером атрибута может служить атрибут “Автор”, а примером его значения - “Джон Смит”.
RDF-утверждение может быть опубликовано вместе с документом, к которому оно относится, помещено на отдельную страницу или вообще в другое место, а также фактически включать в себя описываемый документ. Примером последнего случая служит цифровая подпись, помещенная внутрь сообщения, которое содержит также идентификационные данные автора и его утверждения, заверенные этой подписью. Утверждения могут быть любыми, например “Это все правда” или “Это достаточно невинно для 6-летних детей”.
RDF-утверждения группируются и снабжаются ссылкой на соответствующую схему при помощи простейшего синтаксиса, включающего всего 14 элементов. Все остальные элементы определяются в схеме. Хотя RDF предусматривает только один тип связи между элементами метаданных, допускается вложенность элементов до произвольного числа уровней.
В RDF активно используется недавно предложенное расширение XML - механизм пространств имен. Это расширение позволяет из одного приложения работать с документами двух или более типов одновременно, не опасаясь конфликта, подобного тому, что возникает, когда различные типы документов вкладывают различные значения в теги с одинаковыми именами.
В RDF пространства имен позволяют разработчикам использовать одновременно несколько RDF-схем. Если, например, в двух схемах неодинаков смысл атрибута “Дата”, придать им различие можно с помощью специальных префиксов. Так, чтобы избежать путаницы между атрибутами “Дата” схемы Dublin Core и схемы “Widget”, автор может указывать этот атрибут с соответствующими префиксами, например: DC:Date и WID:Date.
Имонн Салливан (PC Week Labs)