Совместный исследовательский центр организуется в рамках трехгодичного соглашения МГУ им. М. В. Ломоносова и Microsoft Research. Договор о партнерстве, заключенный 7 апреля 2014 г., подразумевает инвестиции со стороны Microsoft в объеме 1 млн. долл. в течение трех лет в университетские направления по обработке и визуализации больших данных и компьютерному зрению, а также в проведение научно-практических мероприятий. Комментируя данное соглашение, ректор МГУ Виктор Садовничий отметил, что ученые все чаще используют для своих исследований новые возможности, которые открылись перед человечеством с развитием Интернета, облачных вычислений, новых способов обработки данных.
Московский университет и Microsoft связывает многолетнее партнерство. В 1995-м было подписано соглашение о сотрудничестве между факультетом вычислительной математики и кибернетики (ВМиК) МГУ и компанией Microsoft, и за прошедшие годы 10 тыс. студентов, аспирантов и молодых исследователей из России приняли участие в совместных проектах и мероприятиях Microsoft Research и МГУ. Корпорация регулярно поддерживает конференции для студентов и аспирантов и летние школы, а в 2000-м в МГУ был передан компьютерный класс с ПО Microsoft Research.
Новый этап взаимодействия подразумевает концентрацию усилий на инновационных направлениях по моделированию сложных систем, компьютерному зрению и визуализации больших данных, для чего Microsoft предоставляет соответствующую инфраструктуру — в частности, Microsoft Azure, Visual Studio 2013, Team Foundation Server. Тони Хей, вице-президент Microsoft Research, в этой связи отметил, что МГУ присоединился к партнерской программе Microsoft, в которой уже участвуют ведущие университеты мира — американский Беркли и английский Кембридж. Летом г-н Хей уже посещал летнюю школу МГУ и остался под впечатлением преданности российских студентов делу — она была явно выше, чем даже у студентов упомянутых зарубежных заведений. При этом отечественные ученые-стажеры также получают возможность проходить практику в иностранных лабораториях. Тони Хей особо отметил растущий спрос на специалистов с хорошей математической подготовкой по аналитике больших данных.
Дмитрий Халин, директор по технологической политике Microsoft в России, напомнил, что заключенное соглашение позволит развивать в России исследовательское направление (Research) в схеме R&D, а что касается разработки (Development), то в конце 2013 г. уже было объявлено о создании центра “Майкрософт Девелопмент Центр”, уже объединившего сегодня 200 специалистов.
Доцент МГУ Сергей Березин, руководитель научной группы по направлению визуализации больших данных, рассказал о ведущихся проектах. Банк климатических данных FetchClimate аккумулирует из множества источников информацию об изменениях в климате планеты начиная с 1900 г. В сочетании с инструментом Distribution Modeller, моделирующим поведение сложных экологических систем, в итоге строится единая интерактивная модель всей экосистемы Земли. При этом процесс расчета того или иного решения, выполняемый на основе байесовских сетей с учетом неопределенности, доступен для просмотра — то есть всегда можно выяснить, как программа обосновывает свое решение. Результат вносимых в систему экспериментальных изменений визуализируется спустя считанные секунды, а расчеты ведутся на кластере из 128 ядер в облаке Windows Azure.
Оригинальная компьютерная “хронология” ChronoZoom визуализирует так называемую “большую историю”, анализируя шаблоны всех исторических событий за 13 млрд. лет. Эта своеобразная машина времени наглядно представляет все эпохи от большого взрыва до наших дней, позволяя проследить взаимосвязи между различными историческими событиями.
Доцент Антон Конушин, возглавляющий лабораторию компьютерной графики и мультимедиа ВМиК МГУ, представил результаты трехлетних исследований — технологии извлечения информации из изображений и видеозаписей, а также анализ массивов трехмерных данных. О сложности этой сферы можно судить, например, по тому факту, что за распознавание и понимание изображений ответственно 25% ресурсов человеческого мозга. Программы лаборатории анализируют как формы изображенных объектов, так и их назначение (смысл) в условиях высокого уровня помех. Например, софт для выделения текстовых надписей на произвольных фотографиях не смущается ни видом шрифта, ни низкой освещенностью и уже обгоняет лучшие коммерческие системы. Анализ видеопотока еще сложнее, но и потенциал этих работ тоже крайне высок. Сейчас ведутся работы по распознаванию на видео людей, лиц и частей тела, а особо востребованы алгоритмы навигации в видеопотоке по интересующим событиям (например, поиск забитых голов в футбольном матче). В перспективе данные программы смогут и синтезировать изображения — изменять движение людей, их одежду и т. д.
Связанной с упомянутыми проектами оказалась и тематика понимания формы трехмерных объектов по массивам “цифровых облаков” (миллионы точек в пространстве), что актуально для прикладного применения сенсорных контроллеров наподобие Microsoft Kinect.
В заключение надо отметить позитивный акцент на деятельности Microsoft Research, который сделал Тони Хей. Подавляющее большинство исследовательских наработок поступят в public domain — будут свободно доступны всем заинтересованным разработчикам.