ИНТЕРВЬЮ
Современная наука требует все более значительных информационных ресурсов - этой очевидной истиной в наши дни мало кого можно удивить. При этом прослеживается довольно интересная закономерность: если несколько лет назад наиболее “компьютеризованными” считались математика, физика и астрономия, то в последнее время все громче заявляет о своих потребностях в мощных вычислительных системах такая молодая дисциплина, как молекулярная биология.
Наука, совсем недавно нуждавшаяся лишь в наборе одноразовой посуды производства фирмы Eppendorf, хорошем хроматографе, светлой голове и умелых руках, вдруг затребовала небывалых компьютерных ресурсов. Достаточно сказать, что такие крупные фирмы, как Hewlett-Packard, IBM и Compaq, инвестировали за последний год сотни миллионов долларов в биотехнологические предприятия, заявив во всеуслышание о том, что их суперкомпьютеры нацелены, в том числе, на решение задач life sciences, “наук о жизни” - как принято называть в западном научном мире совокупность химии, биологии, а также всех промежуточных и конвергентных с ними дисциплин. Емкость биотехнологического рынка к 2003 г. оценивается компьютерными производителями почти в 10 млрд. долл.
Откуда такие суммы? Ответ прост: научные исследования в области life sciences позволяют уже сейчас создавать необычайно эффективные лекарства, трансгенные культуры и многое другое. Возможности “наук о жизни” трудно даже себе представить+
О достижениях и перспективах Пущинского проекта в беседе с корреспондентом PC Week/RE рассказывает заместитель председателя президиума научного центра Вячеслав Васильевич Корнилов.
PC Week: Вячеслав Васильевич, для решения каких научных задач был создан Пущинский академический городок?
Вячеслав Корнилов: Пущино создавалось как научный центр, изначально ориентированный на проведение фундаментальных исследований в области современной молекулярной (иначе - физико-химической) биологии.
Вы знаете, что биология, особенно та ее часть, которая связана с решением генетических проблем, долгое время была в нашей стране “в загоне”. Отношение к ней стало меняться только в 60-х годах, когда стало ясно, что генетика, как и кибернетика, - не “буржуазные бредни”, а нечто вполне осязаемое. Именно на эти годы пришлось создание нашего научного городка, специализированного и прекрасно для своего времени оборудованного. Цель проста - “догнать и перегнать”. К 80-м годам - догнали. По крайней мере, в то время институты Пущинского центра практически ни в чем не уступали своим зарубежным аналогам.
PC Week: Как складывалось положение с вычислительной техникой на заре создания центра?
В. К.: Профессионалов в области молекулярной биологии в то время практически не было. Кстати, даже сейчас их мало где готовят. Поэтому в штат центра вошло много химиков, физиков, математиков и других специалистов. На первом этапе они осваивали измерительную аппаратуру, физические, химические и математические методы исследований в приложении к молекулярно-биологическим объектам. Шел естественный процесс становления нового научного направления. Собственно говоря, компьютеры, эти загадочные ящики с клавиатурой, требующие к тому же специалистов для обслуживания, долгое время не были востребованы в биологических институтах.
В двух словах - база научных институтов была великолепно подобрана. За исключением одного, вычислительной техники.
PC Week: И никаких шагов в этом направлении не предпринималось?
В. К.: Ну почему же. Математики прекрасно понимали необходимость компьютеризации. В то время модным считалось создавать локальные вычислительные центры, большинство научных городков были ими оборудованы. Вот и у нас открылся, как он тогда назывался, Пущинский научно-исследовательский вычислительный центр, на правах института. Возглавил его профессор А. М. Молчанов, ранее работавший в Институте прикладной математики. (Теперь ВЦ превратился в Институт математических проблем биологии.)
Большинство государственных учреждений в то время оснащалось машинами серии ЕС ЭВМ, не обошла эта тенденция и наш вычислительный центр. В выборе компьютеров сыграло свою роль и то, что программы моделирования и обработки данных - западного происхождения - неплохо “ложились” на базу ЕС и с большим трудом могли быть адаптированы к БЭСМ, ПО для которых приходилось писать самостоятельно. В дальнейшем в качестве подсобного инструмента появились машины СМ.
PC Week: Когда начали применять иностранные компьютеры?
В. К.: Самые первые шаги в этом направлении были сделаны в конце 70-х - начале 80-х. Ученые уже начали привыкать к мысли о необходимости использования персональных компьютеров в повседневной работе. В это время мы стали закупать зарубежную технику, в частности, приобрели несколько машин Hewlett-Packard. Кое-что из тех запасов до сих пор хранится в качестве музейных экспонатов+ Иногда даже включаем их.
Затем, на заре перестройки, пришла пора пересмотра ценностей. Чуть позже, в 1988 г., Россия включилась в программу “Геном человека” (Human Genom Program, HGP). Становилось ясно, что на технике ЕС дальше просто нельзя работать. Кроме того, появилась возможность купить то, что надо. Небольшой промежуток времени вместил в себя значительный внутренний подъем, новые надежды и чаяния, а заодно предоставил финансовые средства для покупки “нормальных” ПК, как, впрочем, и каналы их приобретения.
PC Week: Необходимость в более мощных вычислительных средствах появилась, вероятно, позже?
В. К.: Необходимость в вычислительных средствах вообще, по большому счету, созрела только сейчас. Ведь как было? В ряде случаев, уже в разгаре перестройки, покупалась весьма дорогая измерительная аппаратура. В этом деле мы порой даже опережали Запад. В результате денег на специализированную компьютерную технику зачастую просто не оставалось.
Теперь же многое изменилось. Достижения в области химии белка, работы по программе HGP сделали очевидной для профессиональных биологов потребность в колоссальных ресурсах памяти, непривычно больших вычислительных возможностях. Сотни тысяч генов - такой объем информации в голове удержать уже не удастся никому. Тем более проанализировать характер их взаимодействия.
Требования стали дифференцироваться, возникло несколько направлений использования мощной вычислительной техники: моделирование сложных объектов, обработка результатов измерения и создание больших баз данных. Такие задачи решить на обычной “персоналке” нельзя. Простая систематика генетических фрагментов - уже неподъемная задача. Где тот современный Менделеев, который смог бы навести порядок в этом вопросе? Видимо, человеческая голова не приспособлена для решения столь сложных задач. Попытки увязать разные, не до конца понятные явления, как-то их систематизировать уже сейчас приводят к созданию почти в каждом институте, и не только биологическом, групп и группок, занимающихся “биоинформатикой”, “биомоделированием”, в какой-то мере “биокомпьютингом”. Новые направления, не вполне устоявшаяся терминология+ Однако их количество говорит само за себя. И главным инструментом для решения тех проблем, которыми эти направления занимаются, стал мощный компьютер, особенно когда речь идет об исследовании функциональности. Пример - относительно новый драгдизайн, “конструирование” химиками лекарственных препаратов исходя из особенностей функциональности молекул и структуры клеточных рецепторов.
PC Week:: Какие проблемы сейчас актуальны?
В. К.: Одна из первых - создание больших баз данных. Для начала собранный на сегодняшний день громадный материал требуется хоть как-то разложить по полочкам. Несмотря на объявленное “завершение” программы “Геном человека”, эти исследования, видимо, продлятся очень долго. Десятки лет как минимум. Связь и взаимодействие генов - проблема проблем. А ведь ученые уже нацеливаются не только на геномику - науку о строении и функционировании генов, но и на протеомику, изучающую структуру белков, с химической точки зрения значительно более сложных объектов (структурных единиц там не четыре, как в случае нуклеиновых кислот, а целых двадцать). Рациональная стратегия исследований такова: вначале накапливаются данные. Затем выявляются общие закономерности, проводится моделирование и наконец решаются прикладные задачи, образно говоря - конструирование. Мы находимся на первом этапе, поэтому сейчас актуальны накопители данных большой емкости, СУБД, а также программы.
PC Week: Какие шаги вы предпринимаете для решения поставленных задач?
В. К.: Приоритетное направление работ - это создание Центра биоинформатики на базе Пущинского научного центра. Здесь большую услугу нам оказала компания Catalist Silicon Solutions и образованная впоследствии рядом ее менеджеров NC Group/НВК “ВИСТ” (www.ncgroup.ru). В принципе, нам с ними повезло в том смысле, что далеко не всякая коммерческая организация проявляет интерес к науке и оказывается способна лояльно отнестись к “капризам” бюджетной сферы.
Первый договор был подписан в 1998 г., и в рамках начального этапа проекта специалистами “Каталиста” было поставлено и в дальнейшем инсталлировано центральное серверное ядро на базе Origin 200, мощного UNIX-сервера компании SGI (Silicon Graphics). Новая техника требует умелых рук, поэтому технический персонал Центра прошел обучение, что также было оговорено соглашением.
Но на одном серверном ядре далеко не уедешь. Систему необходимо было расширять, поэтому нами была поставлена задача - создать технологический базис Центра биоинформатики. И совсем недавно мы совместными усилиями завершили очередной этап работ, в результате чего оказались обладателями рабочих станций Indigo 2, Octane (производства SGI) и Celsius 420 (Fujitsu Siemens Computers), сервера PRIMERGY 470, а также подключили дисковый накопитель MegaDrive компании DataDirect Networks. Одновременно с этим на базе Института математических проблем биологии в Пущинском центре создан 16-процессорный вычислительный кластер. С таким “арсеналом” научная работа приобретает качественно иной оттенок, однако мы надеемся, что это - лишь начало. Очень хотелось бы расширить сегмент рабочих станций, работающих как под UNIX, так и под Windows NT. Мы надеемся и в дальнейшем плодотворно сотрудничать с NC Group, успешно решающей сложные технические задачи. На мой взгляд, эта фирма вполне могла бы внедрять специализированные программные продукты для научных исследований. Наше пожелание ей - заняться тем, что сегодня принято называть системной интеграцией.
Разумеется, научная сфера не столь богата, как хотелось бы. Графики реальных работ во многом определяются бюджетными планами РАН, однако создание серьезного биоинформационного центра - задача очень важная не для самоуважения, а для решения ряда стратегических задач. Ведь генетика, биотехнологии - это не только модифицированная соя, не только лабораторный инсулин. Возможности манипулирования с генами пока трудно себе представить в полном объеме. Наука, безусловно, входит в новый этап своего развития, мы имеем дело с работами, по своей значимости сопоставимыми с расщеплением атомного ядра.
И для того, чтобы не оказаться на обочине этого процесса, назрела необходимость радикально усилить естественные человеческие ресурсы самыми современными высокотехнологическими средствами. Компьютеры не способны сами по себе решать научные задачи, но решить эти задачи без компьютеров - уже невозможно.