Высокотехнологичная система сканирования помогает жителям штата Массачусетс узнать больше подробностей о своих налогах

 

Налоговая инспекция штата Массачусетс (MDOR) создала новую систему обработки изображений, которая уменьшит мучения, вызванные приближением 15 апреля  -  ужасного срока, до которого необходимо подать заполненные налоговые декларации.

 

Нет, новая система не упраздняет большинства зловредных налогов, которые некогда снискали штату Массачусетс прозвище Налогочусетс. То, что делается, направлено на улучшение использования денег налогоплательщиков с помощью высокопроизводительных интеллектуальных систем оптического распознавания символов (ICR  -  intelligent character recognition), клиент-серверного программного обеспечения проверки достоверности данных, сложных сканеров, технологии хранения и поиска. Все это позволит более эффективно обрабатывать 2,9 миллионов налоговых форм, собираемых ежегодно. Митчел Адамс, член комиссии MDOR, говорит, что снижение стоимости обработки формы с 1,28 доллара до 95 центов позволит окупить систему ценой примерно в 4 млн. долл. менее чем за шесть лет.

 

Подобно другим большим организациям, полностью зависящим от данных, MDOR была богата бумагами, но бедна информацией. MDOR собирала огромное количество налоговых форм, содержащих важную информацию, из которых вводилась в базу данных только их часть. Не реализовалась возможность выполнять задачи поиска данных для выявления тенденций и специфических случаев просроченных или неуплаченных налогов, из-за чего штат ежегодно недобирал миллионы долларов.

 

Агентства по сбору налогов  -  не единственная группа, старающаяся завладеть всей получаемой письменной информацией. Аналитики сообщают об интересе, проявляемом отраслями медицины и страхования, которым тоже необходимы инструментальные средства, чтобы лучше собирать, объединять и обрабатывать формы, которые они получают каждый день. “Возрастающий объем данных и улучшенные возможности их обработки являются источником популярности средств обработки изображений, таких, которые используются в MDOR”,  -  полагают аналитики.

 

Джо Стекки, промышленный аналитик компании Giga Information Group (Кеймбридж, шт. Массачусетс), считает: “Существуют две основные движущие силы этой популярности  -  возрастающая потребность в извлечении большего количества информации из полученных данных и высокая стоимость ввода данных”.

 

Ситуация со сбором налогов

 

Необходимость уменьшения стоимости ручного ввода данных является одной из наиболее часто упоминаемых причин поиска возможности применения систем обработки изображений, и MDOR не является исключением. После того, как MDOR приняла решение о применении системы обработки изображений, в августе 1994 г. было заключено соглашение с корпорацией Unisys, которая подрядилась выступить в роли системного интегратора. Unisys вместе с субподрядчиком  -  фирмой Datacap (Тэрритаун, шт. Нью-Йорк), предоставившей программное обеспечение ICR, создала систему, которая позволяет одному служащему обрабатывать в среднем 600 форм в день. При ручном вводе данных обрабатывается 375 форм.

 

Новая система состоит из трех основных компонентов, обеспечивающих сканирование, контроль введенных данных, хранение и выборку изображения. После того как формы отсортированы и сложены в пачки, они отправляются на одну из шести сканирующих станций, состоящих из высокоскоростного сканера Kodak 923D и ПК с 90 МГц процессором Pentium, на котором работает программа ввода и распознавания Paper Keyboard Scan ICR компании Datacap. Программа читает как рукописные, так и машинописные формы и отмечает все знаки, которые она не может распознать.

 

Если форма расшифровывается без ошибок, то данные автоматически отсылаются на мэйнфрейм Unisys 2200, где обрабатываются. Если ПО обнаруживает расхождение, отсканированная форма отправляется на одну из 54 рабочих станций ввода данных, представляющих из себя ПК Compaq с 90 МГц процессором Pentium, где программа Paper Keyboard Edit компании Datacap на изображении документа отметит места с ошибками.

 

Визуально сравнивая изображение данных с тем, как их ввела ICR, сотрудники MDOR могут легко идентифицировать ошибочные знаки и внести исправления.

 

На последнем этапе обработки информация из налоговых анкет направляется по сети NetWare на мэйнфрейм, на котором установлена модифицированная версия пакета исчисления налогов фирмы Andersen Consulting, называющаяся Mass Tax System. Подсистема хранения пакета Info Image Folder System выполняет роль электронной папки, в которой хранится отсканированное изображение каждой анкеты. Подсистема состоит из четырех библиотек на оптических дисках с автоматической сменой носителей (Juke Box), присоединенных к трем UNIX-серверам.

 

В прошлом только часть информации вручную вводилась в Mass Tax System; копии анкет на бумаге сохранялись в архиве документов. Когда налогоплательщику или аудитору требовалось взглянуть на подлинную анкету, приходилось затребовать и получить форму из архива, что могло занять до двух недель. Новая система обработки изображений дает возможность аудитору или представителю налогоплательщика мгновенно вызвать изображение документа на дисплей.

 

Итоги чистописания

 

Внедрение новой системы обработки изображений не прошло гладко. “Однако проблемы чаще вызывались человеческой природой, а не технологией”,  -  сказал Барри Лури, управляющий отделением налогов и практики сбора налогов корпорации Unisys (Блю-Белл, шт. Пенсильвания).

 

Вот некоторые из непредвиденных проблем: подколотые к анкетам посторонние бумаги; грязные анкеты с неясными каракулями; анкеты на бумаге различной плотности.

 

“Установки сканера требовалось изменять, чтобы избежать "зажевывания" бумаги. Это небольшая проблема в технологии и большой вопрос нашей собственной методологии”,  -  добавил Лури.

 

Никто из сотрудников MDOR не питает ложных надежд, что новая система облегчит заполнение налоговых деклараций. Но многие верят, что их обработка станет более продуктивной.

 

Эйлин Кроули

 

С заместителем редактора Эйлин Кроули можно связаться по адресу: aileen_crowley@zd.com.