Компания Hitachi разработала точный высокоскоростной метод поиска по ключевому слову в объемных архивах звуковых данных. Так, время от начала анализа до нахождения искомого слова в аудиофайле общей длительностью более 2 тыс. ч составляет всего три секунды.
Добиться подобного результата инженерам Hitachi удалось благодаря совмещению сразу двух методов автоматического распознавания речи. Прежде всего применен так называемый метод фонематического поиска (фонема — минимальная значимая звуковая единицая языка). Распознавание происходит следующим образом: изначально звуковые сигналы конвертируются в определенную последовательность символов, затем сохраняется индекс, результирующий все данные о фонетической структуре сегмента. Именно на основе этого индекса происходит поиск.
Однако возможностей поиска, основанного на конвертации звука в последовательность символов, на практике не хватает: точность распознавания довольно низка. Поэтому метод комбинируется с другой технологией поиска — по акустическим характеристикам звука (долгота, тональность, частота). Впрочем, и он имеет свои недостатки: по мнению специалистов Hitachi, подобный глубокий анализ занимает недопустимо длительное время. Именно поэтому новая технология совмещает в себе возможности обоих поисковых методов и позволяет, несмотря на недостатки их раздельного использования, достичь очень быстрого и точного поиска.
Представители Hitachi отмечают, что технология найдет применение в различных сферах. Например, в потребительской среде поиск по ключевому слову в звуковых данных обеспечит быстрый доступ к фрагментам видеофайлов. Также инновационная технология может применяться в работе call-центров (для максимально быстрого доступа к записанным разговорам), полагают в Hitachi.