В центральной исследовательской лаборатории компании Hitachi разработана технология, которая распознает буквы в субтитрах, сопровождающих, например, видеозаписи телевизионных шоу, благодаря чему пользователи могут быстро найти именно тот сюжет, который хотят посмотреть. Средства распознавания букв в субтитрах существуют уже давно, но ранее они с трудом справлялись со своей задачей, если яркость или цвета букв менялись на протяжении одной строки или буквы перемежались графическими образами. Новая технология, по словам экспертов Hitachi, прекрасно справляется с такими трудностями.
Пока не решено, когда эта технология будет выведена на рынок для практического использования. Ее детали будут оглашены на конференции IEICE General 2008 (Insitute of Electronics, Information and Communication Engineers — Институт инженеров в области электроники, информации и коммуникаций), которая пройдет с 18 до 21 марта.
Компания Hitachi протестировала новую технологию на образце, содержащем восемь часов видеозаписей, включая спортивные соревнования, для распознавания имен людей в субтитрах. В результате имена были успешно найдены в 329 случаях и 93% из них были правильно расшифрованы.
В этом тесте Hitachi использовала видео в формате MPEG-2 и настольный ПК для того, чтобы извлечь и распознать текст. Это извлечение и распознавание текста происходило с тактовой частотой 400 МГц. Требовалась емкость для хранения информации объемом не менее 20 Мб. Буквы в субтитрах распознавались в ходе выполнения четырех последовательных процедур:
1. Из видео извлекались прямоугольные области, содержащие субтитры.
2. Из каждой строки в этих областях извлекались последовательности букв.
3. Эти последовательности делились на блоки букв, и из каждого блока извлекались конкретные буквы.
4. Блоки букв сравнивались с ключевыми словами, подготовленными заранее.
Как подчеркивают разработчики компании Hitachi, процедуры 2 и 3 были разработаны впервые, при этом была создана специальная технология извлечения букв с разной яркостью и цветом.