ТЕНДЕНЦИИ

В конце 80-х годов прошлого века японские власти весьма пессимистически оценивали экономическое состояние страны. Независимые эксперты считали, что Япония все сильнее отстает от США по темпам роста и прежде всего из-за того, что у нее практически нет собственных природных ресурсов. После ряда исследований и обсуждений в научных кругах было принято стратегически важное решение, направленное на интенсивное развитие информационных технологий, признанных наиболее значимым ресурсом для Страны восходящего солнца. Это решение опиралось, в частности, на достижения и выводы, полученные в рамках реализации программы по созданию компьютеров пятого поколения (см. PC Week/RE, № 14/97, с. 54). Стало понятно, что информационное будущее Земли неразрывно связано с качественной и быстрой обработкой больших объемов данных и представлением их в виде, доступном для человека, не знакомого с персональными компьютерами. Однако какие именно технологии понадобятся для этого и как их реализовывать, было неясно.

Проект Real World Computing (RWC) был предложен японским правительством в 1989 г. Перед его участниками не ставились излишне конкретизированные цели. Ученые просто думали и экспериментировали в русле заданного направления и занимались поиском путей развития и создания дружелюбных в общении с пользователем компьютеров c параллельной обработкой. Ведь только 10% населения нашей планеты могут свободно общаться с ПК, увеличить этот порог до 80% и был призван RWC. Общий бюджет проекта, объединившего около 50 лабораторий, составил 500 млн. долл. Финансирование осуществляло Министерство внешней торговли Японии.

Основные исследования первоначально велись в Цукубском научном центре. В дальнейшем к RWC присоединились немецкий национальный исследовательский центр компьютерных наук GMD, национальный университет Сингапура NUS, голландский институт SNN, шведский институт компьютерных наук SICS, австралийский университет Сиднея, итальянский институт IRST, британский Манчестерский университет, а контакты с США были организованы на правительственном уровне сразу же с момента официального старта программы в 1992 г.

Первые пять лет участники проекта занимались базовыми научными исследованиями и старались понять, какие ИТ будут перспективны в XXI веке. В результате глубоких аналитических проработок ученые выяснили, что наиболее востребованными станут распределенные параллельные системы, способные в отличие от обычных компьютеров, работающих с абстрактными символьными данными, самообучаться и манипулировать образами реального мира.

Затем, на втором этапе RWC, стартовали работы по интеграции результатов исследований и созданию на их основе прикладных решений в области обработки естественных языков, распознавания образов, моделирования экономического развития, а также управления роботами в масштабе реального времени. Однако задачи создания конкретных продуктов в явном виде по-прежнему не ставились, программа RWC была нацелена главным образом на выработку новой парадигмы гибких систем обработки информации. Основные усилия ученых сконцентрировались на конструировании параллельных оптических систем с большим числом процессоров. В качестве концептуальной платформы для них были выбраны системы с массовым параллелизмом, состоящие из множества дешевых процессоров, а микроэлектронной основой стали оптоэлектронные технологии. С японской концепцией согласен, в частности, Гордон Мур.

Потребность в вычислительных мощностях в мире растет стремительно, в первую очередь они необходимы при выполнении проектов, связанных с моделированием глобальной экономической ситуации, климата, ядерных и химических реакций, с сейсмическими исследованиями, изучением геномов, созданием лекарств, анализом распределения нагрузки в механических конструкциях и т. д. Проект RWC показал, что наиболее эффективны для скорейшего решения всех подобных задач параллельные технологии. При этом множество объединенных процессоров должно уметь решать прежде всего те проблемы, которые сложно разбить на независимые элементы.

Исследования в данной области уже велись японскими специалистами, задействованными в проекте создания компьютеров пятого поколения, однако крайне слабый человеко-машинный интерфейс так и остался одним из наиболее узких мест этого проекта. Компьютеры и машины логического вывода, созданные в его рамках, научились решать весьма сложные задачи, но оказалось, что описывать их в абстрактных, машинных терминах крайне затруднительно. В результате частые ошибки, вносимые на этапе постановки проблемы, не позволяли использовать всю мощь параллельных вычислений. Кроме того, выяснилось, что реализовать заложенную в эти компьютеры идею раздельной обработки потоков данных на каждом процессоре очень непросто, так как от программ требовалось выполнение предварительной структуризации данных с ориентацией на подобные архитектуры. Тем не менее системы пятого поколения наглядно показали потенциальную перспективность языков логического вывода, привязанных к компьютерной архитектуре. Стало ясно, что синхронная обработка больших массивов данных на десятках тысяч процессоров теоретически возможна. Это было показано на ряде узкоспециализированных задач (в частности, из области астрофизики, где развернута система GRAPE из 2048 процессоров).

Поэтому на первый план в RWC вышла концепция естественных пользовательских интерфейсов (Natural User Interface), ориентированных на различные способы человеческого общения и использование слов естественных языков, голосовых сигналов, символов, жестов и изображений. В ходе их реализации были задействованы результаты исследований, которые вели японские университеты, изучая соответствующие типовые шаблоны взаимодействия людей в реальном мире. В результате RWC позволил ликвидировать разрыв между достижениями в сфере искусственного интеллекта и исследованиями в области обработки таких шаблонов (участники проекта назвали это вертикальной научной интеграцией). Например, программы обработки речи и выделения фонем были состыкованы с программами грамматического анализа и выявления смысла. Таким образом удалось гибко формализовать и описать процессы человеко-машинного общения на разных уровнях понимания. Наиболее эффективными подходами к решению подобных задач оказались декларативное программирование и технологии программных агентов, хорошо подходящие для обработки неполной информации. А мостиком между символьным и непрерывным миром послужили алгоритмы распознавания шаблонов.

Другое, горизонтальное направление интеграции исследований по распознаванию речи и образов в рамках RWC привело к появлению концепции интеллектуальных систем, способных анализировать собственную деятельность и самообучаться. Для этого были отобраны подходы, базирующиеся на нейронных сетях. Однако системы агентов, нейронные приложения и машины логического вывода подразумевают выполнение интенсивной обработки больших объемов числовых данных в масштабе реального времени, что возможно только на параллельных архитектурах. Задача создания таких интеллектуальных систем осложнялась нехваткой хорошо структурированных исходных данных (типовых фраз, жестов, рукописных данных, выполненных сотнями тысяч человек и затем оцифрованных). Кроме того, увеличение числа устройств сбора информации резко повышало сложность проблем. Так, проанализировать данные, полученные от стереосистемы, во много раз труднее, чем изображение, полученное от одной камеры. Современные технологии также не позволяют оперативно обмениваться большими объемами цифровых данных (звук, видеокартинка), что потребовало выработки новых алгоритмов сжатия, допускающих разумную потерю качества информации.

В первые годы работы над проектом в RWC формировались концепции обобщения, представления и сортировки информации, поступающей из реального мира и от компьютерных систем в виде, доступном для понимания как людьми, так и программами. Эти концепции ориентировались на аппаратные решения, с помощью которых гораздо проще и быстрее достичь нужной производительности. Такие решения создавались с учетом возможности перенастройки и масштабирования на новые классы задач. Одновременно собирались тестовые БД речи и изображений для обучения программ.

Разрыв между символическим, дискретным способом обработки данных в компьютерах и аналоговым, непрерывным, имеющим место в реальном мире, было решено ликвидировать с помощью технологий так называемой мультимодальной интеграции, подразумевающих объединение нескольких способов общения (голосом, жестами) в одном решении, взаимодействующем с миром благодаря использованию адаптивных механизмов, что предполагает динамическое самообучение и самоорганизацию интеллектуальных систем. Человек воспринимает такое решение в виде персонифицированного программного агента, виртуального персонажа, существенно сглаживающего нестыковки в общении, характерные для программ, используемых в обычных ПК. Агент самостоятельно взаимодействует с окружающим миром и получает сведения от людей, а группы агентов постепенно самоорганизовываются и становятся способными оказывать достаточно сложные услуги. Такие распределенные мультимодальные программы, независимые от ОС и платформ, ищут для человека нужные сведения, выдают подсказки и гибко настраивают свой интерфейс под конкретную прикладную бытовую задачу (“как проехать”, “где отдохнуть”).

(Окончание следует)

Версия для печати