Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
Сети/Серверы/СХД/ЦОД: Статьи Новости компаний Решения

Панорама
Российский суперапп для бизнеса eXpress: новые фичи в 2024 году и планы по развитию В 2024 году рынок корпоративных коммуникаций продолжил развиваться, однако краеугольные камни эффективного рабочего …

Opera готовит мета-поисковик MAMA

Пресс-релиз | 17.10.2008

Компания Opera, разработчик популярного одноименного браузера, анонсировала поисковый механизм Metadata Analysis and Mining Application (MAMA), написанный на Perl с использованием MySQL. Он не только индексирует содержимое сайта, но и запоминает его структуру и используемые веб-технологии, позволяя отыскивать веб-ресусры как по содержимому, так и по структуре. MAMA дает возможность, например, отобрать сайты с не менее чем тысячью ссылок, узнать статистику использования флеша в Сети или посчитать число ошибок разметки для среднестатистического ресурса. Поисковик поможет организациям по стандартизации понять, как в реальности применяются их рекомендации, а разработчики веб-решений смогут точнее учитывать текущие возможности Сети и технические пристрастия пользователей.

Пока MAMA не запущен в эксплуатацию, однако он уже содержит базу с тремя миллионами проанализированных сайтов, на основе которой Opera предоставила интересную статистику. Так, сервер Apache используется в качестве движка 67,7% сайтов, сервер IIS — в 25,9%. Средний объем веб-документа составляет 16,4 тыс. символов. В десятку самых популярных тегов вошли HEAD, TITLE, HTML, BODY, A, META, IMG, TABLE, TD и TR.

Оказалось, что лишь 4,13% сайтов отвечают всем требованиям консорциума по веб-стандартизации W3C, причем одна из самых частых ошибок — отсутствие заголовка DOCTYPE, подсказывающего браузеру номер текущей версии языка разметки HTML, используемого на сайте. Без него велика вероятность некорректного воспроизведения содержимого страницы.

Печать

Opera готовит мета-поисковик MAMA

Комментарии