«Яндекс» научился искать не только с помощью слов, но и с помощью картинок.
Можно найти не только описание изображения, но и любую другую связанную с ним информацию. Например, по картинке товара можно найти интернет-магазин, в котором он продаётся, а по фотографии певицы — сайт, где её фотографий целая коллекция. Наконец, можно просто поискать такую же картинку, но, например, не обрезанную или без подписей.
Новая возможность работает на технологии компьютерного зрения, созданной разработчиками «Яндекса». Она называется «Сибирь» (от англ. CBIR — Content-based image retrieval, то есть поиск изображения по содержанию). После того как пользователь загрузил картинку, поисковая машина превращает её в набор визуальных слов. Визуальные слова — это удобные для поиска численные представления ключевых элементов картинки (границы объектов, контрастные области и так далее). После этого поисковая машина выбирает среди известных ей миллиардов картинок изображения, содержащие такие же визуальные слова, как на загруженной картинке, отсекая все остальные. Это важный этап, потому что для увеличения скорости необходимо сузить область поиска. Потом компьютер сопоставляет расположение ключевых элементов на оставшихся изображениях и выстраивает их по близости к загруженной картинке так, что сверху оказываются наиболее похожие. Всё это занимает меньше минуты.