WEB-ТЕХНОЛОГИИ

Технология RSS, возникшая более пяти дет назад, все сильнее влияет на размещение информации в Сети при обмене данными; более того, она в состоянии существенно повлиять даже на рынки музыкального онлайн-контента и интернет-рекламы. Этот формат постепенно становится самым популярным диалектом языка XML.

Неоднозначное название

Аббревиатура RSS необычна тем, что существует три варианта ее расшифровки, сменявшие друг друга в зависимости от версии формата. Так, под RSS 0.9x понимали Rich Site Summary, то есть "обогащенную сводку сайта". К выходу версии 1.0 эти три буквы стали означать RDF Site Summary. Напомню, что RDF (Resource Description Framework) - это также основанный на XML формат, позволяющий описывать интернет-ресурс понятным для компьютера языком. Он лежит в основе несколько амбициозной, но интересной идеи создания "семантической паутины" (Semantic Web; подробности см. во врезке с соответствующим названием). Следующая (вторая) версия RSS, получившая широкое применение не только у разработчиков интернет-приложений, но и у рядовых пользователей Сети, расшифровывалась гораздо проще и понятнее: Really Simple Syndication, что можно перевести как "действительно простое приобретение информации"*1. Авторство RSS принадлежит компании Netscape, которая создала новый формат исключительно для внутреннего пользования.

_____

*1 Sindicate - агентство, занимающееся перепродажей информации в печатные СМИ. В России этот бизнес пока не прижился.

RSS применяется прежде всего для описания новостных лент, анонсов на сайтах, изменений в блогах и прочих текстовых элементов динамической структуры сайта. Особенность, которой формат обязан своей популярностью, состоит в том, что пользователь может прочитать всю обновленную с помощью RSS информацию, даже не заходя на сайт. Эта технология дает возможность в любое время очень быстро проверить на наличие обновлений неограниченное количество ресурсов и сразу же предоставить новую информацию для удобного чтения. Сайты же, использующие в своей работе RSS, всю обновленную информацию доставляют пользователям мгновенно после ее публикации.

На деле это реализуется следующим образом: сайты генерируют специальные файлы XML (RSS-документы), в обязательном порядке содержащие Web-ссылки на публикуемые материалы, а также заголовки и аннотации к ним.

Такие файлы размещаются в RSS-каналах (лентах, потоках и пр.), на которые посетитель сайта может подписаться. Дальнейшее взаимодействие сайта и пользователя заключается в том, что последний, пробежав глазами дайджест, то есть заголовки и аннотации, и проявив к какому-либо из них интерес, заходит на сайт и читает новый материал полностью.

Загрузка и чтение RSS-каналов производятся с помощью специальных программ, называемых RSS-ридерами или агрегаторами. Такие приложения посылают запросы с заданным временным интервалом по указанным RSS-каналам и при появлении на одном из них новой информации получают дайджест. Агрегаторами могут быть как самостоятельные приложения (наиболее популярны Bloglines и NetNewsWire; в России в силу поддержки русского языка получили распространение Abilion и FeedReader), так и соответствующие плагины браузеров (в частности, средства для работы с RSS есть у Opera, Maxthon, Firefox). При заходе на сайт, поддерживающий передачу информации по RSS-каналу, браузер уведомляет пользователя о возможности подписки на ленту текущего ресурса и, получив согласие, добавляет канал в свой список. Агрегационный сервис ожидается в следующей версии Internet Explorer. Выход инструментов для работы с лентами в составе самого популярного в мире браузера, несомненно, даст еще один мощный толчок к распространению RSS в Сети. Да и наличие онлайн-агрегаторов (например, www.bloglines.com), то есть сайтов, предоставляющих возможность создания и чтения собственного каталога RSS-каналов, стимулирует рост почитателей технологии. А постоянному появлению новых лент способствует простота их создания и поддержки.

Структура RSS-документа

<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0">

<channel>

<title></title>

<link></link>

<description></description>

<image>

<url></url>

<link></link>

<title></title>

</image>

<lastBuildData></lastBuildData>

<item>

<title></title>

<link></link>

<description></description>

</item>

+

</channel>

</rss>

     Теги:

     - <title> - здесь помещается заголовок канала     

     - <link> - ссылка на сайт     

     - <description> - описание канала     

     - <image> - вставка изображения (как правило, графика в RSS-каналах не используется)

     - <description> -дата обновления контента

     - <item> - вставка собственно новости или статьи (обычно в документ помещается не весь материал, а только заголовок и анонс)

    

Эволюция формата

Правда, факторы, сдерживающие развитие RSS в Сети, тоже есть. В первую очередь это несовместимость различных версий формата, требующая от разработчиков дополнительных усилий по поддержке всех вариантов в своих агрегаторах. Список "подформатов" приведен в таблице "Эволюция RSS".

Затруднения с совместимостью имеют место и при считывании внедренных в RSS-документы HTML-фрагментов, которые могут быть оформлены двояко (соответствующие способы кодирования носят названия CDATA и PCDATA). При этом стоит добавить, что некоторые компании ведут разработку аналогов RSS. Наиболее известный из альтернативных вариантов - формат Atom, продвигаемый Google (впрочем, даже канал Google News можно читать через RSS-ридеры). В январе 2005 г. о своей поддержке альтернативного формата заявили в Microsoft. Однако и от RSS корпорация отказываться не собирается. В RSS работают все сервисы подразделения Microsoft Solutions Navision, а к запуску готовится первая версия онлайн-агрегатора My MSN RSS. Кроме того, представители корпорации предполагают внедрить формат в системы передачи мгновенных сообщений и интернет-поиска.

Существуют также и различные технологии составления списка RSS-каналов для экспорта-импорта сразу нескольких лент. Речь идет о возможности добавлять в агрегатор один файл при подписке, вместо того чтобы загружать каждую ленту в отдельности. Например, при подписке на RSS-каналы достаточно указать в специализированном интернет-каталоге все заинтересовавшие вас ленты и загрузить в RSS-ридер автоматически сгенерированный файл со списком. Такие файлы могут быть двух форматов: OCS (Open Content Syndication) и OPML (Outline Processor Markup Language). Последний в настоящее время более популярен, возможно, потому, что он более удобен для редактирования вручную.

"Семантическая паутина"

Semantic Web - это новая концепция развития Интернета, разработанная Консорциумом W3C. Паутина нового типа представляет собой надстройку к уже существующей WWW и призвана сделать информацию, размещенную в Интернете преимущественно в текстовой форме, более "понятной" для компьютеров. Поскольку прогресс в сфере ИТ пока не позволяет научить компьютеры "осмысливать" текст, разработчики решили пойти иным путем. А именно - создать сеть, где каждый ресурс на "человеческом" языке снабжается специальным описанием. Этот "довесок" к сайту (метаданные) хранится в файле RDF-формата. Документы RDF обрабатываются автоматически и не предназначены для прочтения и использования человеком.

Результатом построения "семантической паутины" может стать четко структурированная информация, доступная любым приложениям вне зависимости от платформы. В такой сети "нового поколения" компьютеры будут самостоятельно находить нужные ресурсы, обобщать данные, выявляя логические связи, а также делая выводы и, возможно, принимая решения на их основе. Недостаток концепции заключается в сложности понимания и освоения RDF и OWL (Web Ontology Language - специальный язык для обработки информации в "семантической паутине"). Первым крупным проектом в данной сфере стал DCMI (Dublin Core Metadata Initiative, "Дублинское ядро"). В рамках DCMI проводится разработка словарей метаданных для стандартизации описания Web-ресурсов в RDF.

В завершение разговора о технической специфике формата RSS стоит упомянуть о том, что к настоящему времени версия 2.0 уже не является "венцом творения". Летом этого года на суд интернет-общественности был представлен "бизнес-преемник" популярного формата - RSSB. В отличие от RSS 2.0, ориентированного в первую очередь на работу с новостными лентами, RSSB создавался прежде всего для работы с B2B-сегментом электронной коммерции. Его главная задача - сбор и рассылка отраслевых предложений и заявок. Вместе с тем RSSB-документы остаются совместимыми с файлами "второго поколения", и прочесть их можно будет в уже существующих агрегаторах. Жестко структурированные элементы RSSB-файлов содержат данные, описывающие объекты торговли или инвестирования. Благодаря стандартному виду полей обработка сервером поступающих в этом формате данных упрощается. Информация может быть сохранена на сервере, ретранслирована на другие сайты или прочитана пользователями RSS-ридеров. Предполагается, что распространение бизнес-расширения RSS приведет к появлению RSSB-сетей, представляющих собой глобальные массивы деловой информации. Очень важно, что каждое обновление в базе участника RSSB-обмена мгновенно транслируется всем партнерам. Таким образом, кстати, можно избежать и дублирования предложений/заявок на сайтах. Подробная информация о формате имеется на сайте www.bsf.ru.

Аудио по RSS-потокам

Если текстовый контент, транслируемый по RSS, угрожает существованию интернет-изданий, то аудиофайлы, распространяемые по тому же принципу, заставляют настораживаться владельцев интернет-радио. Сервис, получивший название "подкастинга", дает пользователю возможность формировать индивидуальные программы прослушивания различных аудиопередач (аналогично выбору каналов для чтения в агрегаторе). Термин является производным от двух слов - iPod (популярный mp3-плейер разработки Apple) и broadcasting (вещание). Соответствующая служба Apple iTunes Podcast Directory уже через два дня после запуска обзавелась миллионом подписчиков, получивших доступ к трем тысячам бесплатных аудиопрограмм, включая передачи ABC News, BBC, Disney, ESPN, Newsweek и NPR.

Первой в мире радиостанцией, реализовавшей подкастинг в своей деятельности, стала KYOURadio (Сан-Франциско, США), принадлежащая Infinity Broadcasting.

Летом 2005 г. подкастинг появился в мобильных телефонах. Соответствующий софт был выпущен компанией Melodeo.

А в мае первый подкаст-проект был основан в Рунете по адресу: www.russianpodcasting.ru

А уже в августе общественность получила возможность обсудить предварительные спецификации RSS 3 (www.rss3.org). Третья версия будет представлять собой доработанную RSS 2.0 и сохранит совместимость с "предшественником". Известно, что в RSS 3 будут заполнены пробелы в документировании, устранены ставшие ненужными и добавлены некоторые новые функции.

Убийца "классической" рекламы

Когда-то практически все пользователи Сети, вдохновленные открывшимися возможностями Всемирной паутины, бросились создавать свои сайты. Результатом этого поветрия стали миллионы непосещаемых и необновляемых домашних страниц. Можно ожидать, что по мере роста популярности формата RSS схожая ситуация в скором будущем постигнет и RSS-ленты. Однако если для большинства частных пользователей возможность создавать свои каналы - не более чем модное развлечение, то для компаний это еще одно оружие интернет-маркетинга. Пользователь, который зашел на корпоративный сайт единожды, в дальнейшем может просто забыть о нем. Если же посетитель загрузил в свой агрегатор RSS-канал этого сайта, то он будет регулярно получать новости о компании. Кроме того, нельзя не учитывать тот факт, что в Интернете уже имеются каталоги RSS-лент, по форме аналогичные каталогам сайтов. У этих ресурсов есть своя аудитория, предпочитающая Web-серфингу просмотр дайджестов в агрегаторе. Принимая во внимание рост численности этой аудитории, игнорировать ее становится просто глупо.

В результате все больше сайтов обзаводится стандартными кнопками с белой аббревиатурой XML, RSS или RSS 2.0 на оранжевом фоне, что означает наличие RSS-канала. И хотя пока с RSS-ридерами работает не более 5% интернет-пользователей, перспективы RSS-каналов всерьез настораживают владельцев "традиционных" интернет-СМИ. Во избежание падения интереса к своим ресурсам они вынуждены и сами открывать ленты. В прошлом году соответствующие проекты были запущены сразу несколькими информационными порталами. Крупный издательский холдинг CNET предлагает пользователям для бета-тестирования агрегатор собственный разработки Newburst, в который сотрудники компании загружают лучшие статьи. Через подобный корпоративный RSS-ридер NewsPoint (разработка компании Consenda) начали "вещание" Los Angeles Times и Guardian. За чтение контента взимается плата по ежемесячной подписке (впрочем, есть период, в течение которого пользователи могут бесплатно оценить возможности агрегатора). Всего же на апрель 2005-го, по данным Международной федерации периодической прессы, 30% интернет-изданий в мире использовали RSS в своей работе.

Эволюция RSS

Информационным порталам, доход которых практически полностью зависит от интереса рекламодателей, есть чего бояться. Сохранить же заказчиков будет сложно, так как пользователь, читающий RSS-ленты без посещения сайта, просто не увидит рекламной информации. Впрочем, уже появились первые попытки спасения интернет-рекламодателей от разорения. Компании Pheedo и Overture (подразделение Yahoo!) специализируются на разработке ПО для интеграции рекламы в RSS-заголовки. При этом рекламу можно поставлять как отдельные RSS-заголовки либо интегрировать в информационные заголовки или в отдельные информационные сообщения в блогах. Аналогично баннерам новую рекламу можно будет оплачивать по результатам показов, переходов или действий.

В Google начали размещать свою контекстную рекламу (проект AdSense) внутри RSS и Atom-каналов, что, кстати, позволяет владельцам блогов получать деньги. Принцип работы рекламного механизма остался прежним. Содержание заголовка анализируется, после чего в него автоматически вставляется рекламная ссылка, попадающая в RSS-ридер читателя вместе с заголовком. За каждый переход по ссылке владелец RSS-канала получает определенную сумму. Рекламодатель может настроить частоту появления рекламы, количество ссылок в заголовке и место их размещения. Аналогичная рекламная сеть в скором времени может быть реализована Yahoo!. Кстати, согласно опросу, проведенному компанией Blogskit, около 71% блоггеров не высказываются против появления рекламы на страницах своих дневников.

RSS шагает по Интернету

Таким образом, пока одни интернет-бизнесмены пытаются спасти свое дело от неожиданной напасти, другие, напротив, используют возможности новой технологии. В июле этого года компании Santa Cruz Tech и PubSub объявили о запуске совместного проекта The Blog Herald - приложения, позволяющего отслеживать обновления на нескольких миллионах сайтов через RSS. При этом сервис поддерживает работу даже с мобильными телефонами - на уровне отсылки уведомлений о наличии нового контента по SMS. Не забыли про мобильные технологии и в Yahoo!. В марте этого года корпорация огласила свои планы по созданию специализированной ленты новостей, адаптированной для просмотра с мобильных устройств. Проект был запущен в рамках многофункциональной службы My Yahoo! и поддерживает не только RSS, но и Atom.

На глобальный охват претендует еще один RSS-проект - Kinja (www.kinja.com). Данный ресурс представляет собой агрегатор, в котором проводится мониторинг подавляющего большинства интернет-блогов, сгруппированных по различным тематикам (политика, технологии, видео и т. д.). Тематические ленты можно читать как целиком, так и выбирая лишь наиболее интересные RSS-каналы. Ключевым достоинством своего детища разработчики проекта считают его ориентацию на широкий круг пользователей. Августовский опрос Nielsen/NetRatings показал, что лишь 15,7% американских пользователей Интернета слышали о RSS, из них только 11,3% применяют формат в своей работе (как правило, это наиболее активные пользователи, 4,9% из которых работают через RSS-ридеры, 6,4% - с помощью онлайн-агрегаторов). Kinja призвана предельно упростить процедуру использования технологии для ее популяризации*1.

_____

*1 Кстати, говоря о RSS-сервисах, нельзя пройти мимо еще одной новинки - www.rss2pdf.com. На этом сайте можно ввести ссылку на OPML- или RSS-файл и получить соответствующий PDF-документ. Есть здесь, однако, и ложка дегтя: кириллица пока не поддерживается.

На конференции Search Engine Strategies 2005 RSS-ленты были упомянуты еще и в качестве нового инструмента интернет-маркетинга (оригинальная версия соответствующего доклада доступна по адресу: http://searchenginewatch.com/searchday/article.php/3502041). Дело в том, что для поиска информации RSS-каналов уже созданы специализированные серверы. Добавить ленту для индексации теперь можно с помощью специализированных сервисов Moreover.com, Yahoo!, Feedster.com и др. А если есть поисковики, то должна быть и оптимизация результатов поиска для привлечения дополнительных посетителей на сайты. В ходе конференции участники еще раз вспомнили о том, что в Интернете неуклонно снижается количество публикуемого контента во всех видах, кроме блогов (работающих на RSS).

Сайт Clickz.com собрал воедино примеры использования RSS в маркетинге. Среди наиболее популярных способов можно отметить суммирование в одной ленте информации о скидках в различных магазинах (например, couponbar. com), распространение пресс-релизов по RSS-каналам (налажены информационные потоки от IBM, Apple, Microsoft, Google и др.), публикацию по тем же каналам кадровых объявлений (кстати говоря, по этому поводу начинают волноваться специализированные газеты и ресурсы) и, наконец, брендинг-контент. Примером последнего может послужить блог производителя йогуртов о здоровом питании (www.stonyfield.com).

Портрет пользователя RSS

Исследование, результаты которого Yahoo! огласила в октябре этого года, позволило четче представить аудиторию читателей RSS-каналов.

Выяснилось, что среднестатистический пользователь RSS - это мужчина в возрасте 18-34 лет с высшим образованием и высоким уровнем дохода. Он подписан на 6,6 канала, которые читает 4,1 часа в неделю. При этом предпочтение отдается международным и национальным новостям (по 52%). Далее следуют: развлечения - 34%, наука и техника - 32%, погода - 31%, местные новости - 31%, блоги - 23%, новости спорта - 22%, региональные новости - 21% и т. д.

И наконец, самый интересный вывод: пользователь RSS в среднем зарабатывает на 900 долл. в месяц больше, чем тот, кто не читает RSS-каналов.

Перспективность формата подкреплена вполне реальными цифрами. В этом году был образован инвестиционный фонд, ориентированный на развитие RSS-технологий. Начальный бюджет фонда составил 100 млн. долл. Окончательное признание RSS фактическим стандартом для распространения информации произойдет после выхода Windows Vista, где формат, как предполагается, будет широко использоваться.

Вместо заключения: Рунет

В июне прошлого года в русском сегменте Сети появился первый каталог RSS-каналов. Первопроходцем стал ресурс www.kanban.ru, который к моменту написания статьи позволяет подключиться к 1933 каналам, сгруппированным по тематическим категориям. Российских компаний, транслирующих свои новости по RSS-каналам, пока немного, однако, как и следовало ожидать, там уже появились представители ИКТ-отрасли. В частности, первое место по числу подписчиков занимает МТС, что обусловлено ритейл-характером бизнеса этой компании. Взяли RSS на вооружение и PR-менеджеры компании "Парус". Кроме того, формат начинает пользоваться успехом у государственных и муниципальных учреждений, таких, как Министерство культуры, Мосгортранс, региональные администрации и т. д. В целом же наиболее популярны новостной канал "Яндекс.Новости", информация о новых статьях на iXBT.com, а также новости от Lenta.ru и "Компьюленты".

В нынешнем июле произошло следующее громкое событие, связанное с продвижением RSS в Рунете. Культуру новых технологий распространения информации среди отечественных пользователей решили насадить в "Яндексе", разработав собственный онлайн-агрегатор. Как и сам RSS в свое время, проект "Яндекс.Лента" (lenta.yandex.ru) изначально создавался для внутреннего пользования, однако позже возможность быстро читать новости и публикации знакомых блоггеров появилась у всех посетителей портала.

Обновление персональной "Яндекс.Ленты" происходит автоматически в реальном времени. Самые новые сообщения выводятся на первой странице. Предусмотрена возможность формирования папки с любимыми записями. Сервис обрабатывает документы как в RSS, так и в Atom. На сегодняшний день "Яндекс.Лента" отслеживает более 200 тыс. потоков. Блоггерам предлагается размещение на своих страницах специальной кнопки, одним щелчком на которой читатель может добавить блог в свою "Яндекс.Ленту". Так же быстро завоевал популярность еще один сервис "Яндекса" - поиск по блогам и форумам (blogs.yandex.ru). Кстати, аналогичная разработка Google (www.google.com/blogsearch) появилась только в сентябре 2005 г., а своим RSS-ридером (www.google.com/reader) корпорация обзавелась и вовсе в октябре