Теперь цифровая ручка C-Pen может распознавать, сохранять и переводить тексты, набранные на 53 языках
Среди сотен тысяч пользователей портативных цифровых ручек C-Pen (www.cpen.com), выпускаемых шведской компанией C Technologies AB (www.ctechnologies.se) c 1998 г., немало студентов, которые берут их с собой в читальные залы, дабы буквально за секунду перевести непонятное слово или отсканировать, распознать и запомнить в виде символьных файлов наиболее интересные фрагменты текстов из учебной, научной или художественной литературы. К сожалению, до недавнего времени эти чудо-перья не понимали кириллицу (в силу используемой ранее OCR им были знакомы лишь девять основных западноевропейских языков), а предназначенные для них электронные словари не владели русским языком. Однако в 1999 г. шведы обратили-таки внимание на быстрорастущий восточноевропейский ИТ-рынок. Оценив возможности системы распознавания FineReader 4.0 и семейства словарей Lingvo 6.0. (www.lingvo.ru, два общих и 12 специализированных, общим объемом свыше 1 млн. словарных статей), разработанных компанией ABBYY Software House (www.abbyy.ru), они решили встроить эти продукты в C-Pen и заключили с россиянами соответствующее соглашение (см. PC Week/RE, № 43/99, с. 8).
Цифровая ручка C-Pen без проблем обменивается
данными с компьютером, сотовым телефоном,
органайзером Palm и другими устройствами
В феврале ABBYY Software House, C Technologies и дистрибьюторско-сервисная компания Galaxy Computers (www.psion.aha.ru) объявили о завершении интеграции системы распознавания FineReader 4.0 и двух словарей семейства Lingvo 6.0 (англо-русский и русско-английский словари общей лексики) с цифровой ручкой C-Pen и о начале продаж этого замечательного изделия в России, а также в Польше, Венгрии и Чехии.
Региональный менеджер C Technologies Станислав Гучиа (Stanislav Guchia) отметил, что отныне все производимые шведами C-Pen’ы используют специальный, “зашитый” в ПЗУ вариант OCR FineReader 4.0 (это позволило увеличить число понимаемых ими языков до 53), а перья, поставляемые в Россию (модель с индексом 600MX, www.cpen.ru), еще на заводе-изготовителе снабжаются двунаправленным словарем общей лексики из семейства Lingvo 6.0.
Ручка C-Pen 600MX содержит встроенную цифровую камеру, которая “фотографирует” считываемую строку (длина строки - до 22 см) со скоростью 100 кадров в секунду и затем, используя запатентованную фирменную технологию, “склеивает” полученные “отпечатки” так, чтобы “панорама” распознаваемой строки была максимально близка к оригиналу. Это позволяет сгладить неизбежную волнообразность хода пера (ведь мало кто обладает абсолютно твердой рукой и может провести идеальную прямую линию без использования специальных приспособлений!) и обеспечивает сканирование даже очень мелких строк текста со скоростью до 15 см/с.
Благодаря энергонезависимой флэш-памяти ручка C-Pen 600MX в автономном режиме (т. е. без связи с компьютером) способна распознать и запомнить до 800 Кб текста, который может храниться внутри нее в виде поименованных (длина имени - до 50 символов, по умолчанию используются первые три слова запоминаемого текста) иерархически организованных (до 64 уровней вложения) файлов. Эти файлы в любое время могут быть переданы в ПК по инфракрасному или последовательному порту (в комплект поставки входит ПО для PC-совместимых машин, с помощью которого накопившиеся в ручке файлы представляются пользователю в виде дополнительного жесткого диска). Накопленную в ручке информацию можно (по инфракрасному порту) отослать в сотовый телефон, органайзер Palm или другое полезное устройство. Возможна также запись данных в ручку.
“Основная сложность данного проекта заключалась в том, что шведы предъявили очень жесткие требования к системе распознавания для своей цифровой ручки: с самого начала переговоров нам было сказано, что ее размер не должен превышать 2 Мб, что примерно в 10 раз меньше, чем объем стандартной версии. Тем не менее эта задача нами была успешно решена. Причем без заметной потери качества распознавания текстов на любом из 53 языков”, - отметил генеральный директор ABBYY Software House Сергей Андреев.
Сергей Андреев (справа) и Станислав Гучиа рассказывают о
светлом будущем миниатюрных запоминающих сканеров
Кроме запоминания в автономном режиме, новинка, если ее подключить к ПК, позволяет передавать отсканированную и распознанную текстовую информацию непосредственно в MS Word или Excel. При этом фрагменты считываемого текста попадают в то место формируемого документа, где в данный момент находится курсор. Загруженный в перо софт легко модифицируется. Примерно полтора десятка словарей стоимостью около $30 каждый можно найти на сайте www.cdictionary.com (число устанавливаемых словарей зависит от объема свободной памяти).
“Компания C Technologies обычно использует для своей сканирующей ручки наиболее авторитетные из существующих словарей - Oxford, Merriam-Webster’s и Norstedts. То, что система словарей Lingvo попала в такую блестящую компанию, мы расцениваем как важное признание проделанной нами большой работы, - сказала руководитель проекта Lingvo Анна Ермолаева. - Под словарь нам разрешили занять не более 4 Мб памяти. Поэтому нашей основной задачей стало максимальное сохранение его полноты при отведенном для него скромном объеме. В итоге в версию для C-Pen вошел словарь общей лексики, содержащий около 62 тыс. словарных статей в англо-русской части и более 50 тыс. статей в русско-английской. Для сравнения: полная версия словаря общей лексики, входящего в состав семейства Lingvo 6.0, - 90 тыс. статей в англо-русской части и 70 тыс. - в русско-английской. Мы сделали все возможное, чтобы пользователь получил полноценную версию Lingvo, и постарались минимизировать количество сокращений в словаре, насколько это было возможно. И, кажется, нам это неплохо удалось”.
Органов управления у ручки C-Pen 600MX всего три: клавиша включения цифровой камеры, кнопка ESC (для удаления выделенных фрагментов текста и выхода из приложений) и миниатюрное колесико-навигатор, позволяющее выбрать иконку нужного приложения и перемещаться между элементами меню.
В настоящее время ориентировочная розничная стоимость C-Pen 600MX - $260. По словам технического директора Galaxy Computers Алексея Безлепкина, первая партия завезенных в нашу страну устройств (300 шт.) была раскуплена буквально за несколько дней. Г-н Безлепкин надеется, что в странах СНГ будет продаваться приблизительно 500 локализованных OCR-ручек в месяц. Первыми российскими компаниями, взявшимися за распространение этих чудо-перьев, стали торговые дома “Белый Ветер”, “КомпьюЛинк”, “Мобильный компьютер”, “М-Видео”, “Партия” и “Электон”. Техническое обслуживание новинки, включая гарантийный ремонт, осуществляет Galaxy Computers.
ABBYY Software House: (095) 234-4400.
Galaxy Computers: (095) 243-2063.
Основные технические характеристики C-Pen 600MX
Габариты: 140х35х24 мм.
Масса: 80 г (с батареями).
Процессор: 70 МГц Argus.
Операционная система: ARIPOS.
Объем флэш-памяти: 6 Мб (4 Мб занимает словарь, а остальные 2 Мб предназначены для хранения распознанных текстов и различных приложений).
Размер считываемого шрифта: от 6 до 24 пунктов *1.
Скорость считывания: 15 см/с.
Дисплей: графический, четырехстрочный.
Питание: две батареи типа ААА, которых хватает примерно на две недели работы.
Протокол инфракрасного порта: IrOBEX.
Цвет текста: сканирующие ручки C-Pen не могут читать красный или желтый текст на белом фоне или белый текст на красном фоне.
_____
*1. Пункт - принятая в типографском деле единица длины, равная 0,376 мм. Используется при указании высоты букв.