IBM сообщила об успехах в усовершенствовании когнитивных возможностей своей системы Watson, которая теперь позволяет не только сверхбыстро анализировать данные для поиска известных ответов на вопросы, но и выдавать доказательства, обосновывающие эти ответы и наводящие на новые вопросы.
Новые возможности позволяют упростить сложное, раскрывая связи в больших массивах данных, рассказал eWeek Роб Хай, вице-президент и технологический руководитель IBM Watson Group.
«Мы входим в эпоху небывалых открытий на основе анализа данных, — заявил Майк Родин, старший вице-президент IBM Watson Group. — Разрастание объемов накопленной информации усиливает возможности организаций по выявлению связей между разнородными данными. Предмет настоящего сообщения является естественным расширением когнитивного вычислительного интеллекта Watson, который вооружит исследователей, разработчиков и отраслевых специалистов мощными средствами проникновения в данные и связи между ними. Это позволит ученым находить такие взаимосвязи данных, которые не видны другим, что может открыть путь к революционным открытиям».
По словам Хая, IBM Watson Discovery Advisor является системой, которая способна визуально формировать образы и точно выявлять связи внутри данных. Представленная в виде облачного сервиса она предназначена для расширения масштабов и ускорения темпов научных поисков, а ее использование, как заявляют в IBM, сократит время проверки гипотез и формулировки выводов в ходе работы исследовательских групп с месяцев до дней, а с дней буквально до часов.
Обновленный сервис Watson Discovery Advisor не только отображает ранее неизвестные корреляции между ключевыми элементами данных и понимает нюансы обычного человеческого языка, но и разбирается в языке формул химических соединений и их взаимодействия, что имеет огромное значение для открытий в биологии, медицине и других областях знания. Систему можно научить разбираться в вопросах разных отраслей, в том числе биологии, интеллектуальной собственности и юриспруденции, что способно оказать глубокое воздействие на специализированные исследования и разработки.
Исследователи и ученые ведущих организаций в медико-биологической сфере, включая академические, фармацевтические и исследовательские центры, уже начали развертывать новый сервис IBM Watson Discovery Advisor для преодоления серьезных сложностей, связанных с абсорбированием и анализом материалов миллионов научных работ, содержащихся в публичных базах, и созданием на их основе гипотез. По данным организации National Institutes for Health, типичный исследователь прочитывает в месяц примерно 23 научные статьи, т. е. около 300 статей в год. Однако новые научные работы публикуются в среднем каждые 30 секунд, и, как отмечает IBM, человек физически не может оставаться в курсе постоянно нарастающей массы научных материалов.
IBM усилила свою когнитивную вычислительную систему Watson, чтобы она умела выявлять в данных ранее невидимые связи, которые могут приводить к крупным открытиям.
Во многих отраслях успешные исследования и разработки требуют огромного труда и больших затрат. Так, в 2013 г., по данным Booz & Company, первая тысяча крупнейших компаний этого профиля потратила за год только на сами исследования 638 млрд. долл. А по информации Pharmaceutical Research and Manufacturers of America, на продвижение новых методов медикаментозного лечения с начальной стадии исследований до внедрения в практику уходит в среднем
Ведущие медико-биологические научные организации, в том числе Медицинский колледж Бэйлора, Johnson & Johnson и Нью-Йоркский геномный центр, развертывают Watson Discovery Advisor для ускорения исследований по своим текущим проектам.
По словам Хая, ученые из Бэйлора и IBM продемонстрировали возможный новый путь к генерации научных вопросов, который в перспективе может принести пользу при разработке новых методов лечения болезней. Буквально за несколько недель биологи и специалисты по обработке данных, использовавшие Baylor Knowledge Integration Toolkit (KnIT) на базе технологии Watson, сумели собрать точную информацию о белках, которые модифицируют белок p53, подавляющий развитие многих форм рака, что со временем позволит повысить эффективность лекарств и других типов лечения.
Без когнитивных возможностей Watson у исследователей на достижение этого результата ушли бы годы, сказал Хай. Watson проанализировал 70 тыс. научных статей по p53, чтобы предсказать, какие белки запускают или приостанавливают активность p53. Благодаря этому автоматизированному анализу исследователи рака из Baylor отобрали шесть потенциальных белков для новых исследований. Это выдающийся результат, говорят в IBM, учитывая тот факт, что в последние 30 лет ученые отбирали для исследований в среднем один белок в год.
«В нормальный рабочий день ученый может в среднем прочитать от одной до пяти научных статей, — сказал Оливьер Ликтадж, главный исследователь и профессор Медицинского колледжа Бэйлора по генетике человека, молекулярной генетике, биохимии и молекулярной биологии. — Что касается p53, то по этой теме опубликовано более 70 тыс. статей. Даже если бы я прочитывал по пять статей в день, у меня ушло бы примерно 38 лет, чтобы полностью разобраться в имеющихся на сегодня исследованиях по этому белку. Watson продемонстрировал свой потенциал по ускорению и повышению качества революционных научных результатов».
Компания Johnson & Johnson сотрудничает с командой IBM Watson Discovery Advisor в обучении компьютера читать и понимать научные статьи с подробностями результатов клинических испытаний лекарств. Обе стороны надеются ускорить исследования сравнительной эффективности лекарственных препаратов. Такие исследования помогают врачам выбирать правильное лекарство для соответствующего круга пациентов, чтобы обеспечить максимально эффективный результат с минимумом побочных явлений.
Как правило, исследования сравнительной эффективности проводятся ручными способами, при которых три человека затрачивают в среднем 10 мес (или 2,5 человеко-года) только для сбора данных и подготовки их к обработке еще до начала анализа и формулировки и проверки гипотез, говорят в IBM. Группа из представителей двух организаций надеется научить Watson быстро синтезировать информацию прямо из медицинской литературы, чтобы исследователи могли немедленно начинать формулировать вопросы для анализа данных с целью определения эффективности использования лекарства в сравнении с другими препаратами, а также его побочных эффектов.
Еще од пример — совместная работа IBM и Нью-Йоркского геномного центра над клиническим исследованием по использованию Watson в геномной медицины. По информации IBM, первоначально сотрудничество будет сфокусировано на клиническом применении когнитивной компьютерной системы в помощь онкологам, занимающимся лечением глиобластомы (агрессивной формы рака мозга, от которой ежегодно умирает более 13 тыс. американцев) на основе изучения ДНК. Цель исследования — оценка возможностей Watson в оказании помощи врачам при анализе сложных данных для выбора персонализированных вариантов лечения пациентов с глиобластомой на базе их специфических генетических мутаций.
«Прежде мы концентрировались на том, чтобы дать людям возможность получать ответы на задаваемые ими вопросы. Теперь мы расширили возможности системы и перевели их на ступень открытий, чтобы помогать людям узнавать такие вещи, про которые они не спрашивают, но должны спрашивать», — сообщил eWeek Хай.
Watson теперь умеет представлять обоснования ответов на поставленные вопросы. «Точность этих обоснований не менее, если не более важна, чем точность ответа, — считает Хай. — Если говорить о роли этих функций в мире когнитивных вычислений, то она не только в том, чтобы делать работу за людей, но и в том, чтобы люди могли работать лучше. Я бы сказал, что в процесс включается внушение. Мы можем внушать людям новые идеи, до которых они сами могли бы не дойти. Мы помогаем людям ставить вопросы, до которых иначе они могли бы не додуматься».
Открытие нового возможно во многих областях, включая медицину, юриспруденцию и финансовый мир, где требуется глубокое проникновение в большой объем информации и протоколов. Когнитивные вычисления позволят специалистам оперировать большими объемами данных, результатами исследований, знаниями и оценками, добытыми множеством других специалистов той же области.
IBM Watson Discovery Advisor для медико-биологических наук представляет собой интегрированный пакет технологий, поставляемых как облачный сервис. Технология формирует карту информации путем логических умозаключений над образами, которые она видит в существующих данных, трансформируя сырые данные в новое знание.
Аппаратура IBM Power Systems будет поддерживать технологию изучения данных Watson, обеспечивая ускоренный доступ к большим данным. Watson Discovery Advisor обладает потенциалом трансформации отраслей и профессий, сильно связанных с данными, включая юриспруденцию, фармацевтику, биотехнологию, образование, химический синтез, металлургию, научные исследования, машиностроение и расследование преступлений, считают в IBM.
Через три года после триумфального выигрыша в телевизионной викторине «Jeopardy!» IBM превратила Watson из игрового изобретения в коммерческую технологию. Ныне доступный через облако и вооруженный новыми пользовательскими и корпоративными приложениями, Watson стал умнее, быстрее и компактнее — его производительность выросла в 24 раза, а физические размеры сократились на 75%.