В марте в Москве состоялся открытый фестиваль по анализу данных Data Science Week, посвященный технологиям глубокого обучения и искусственного интеллекта. Придя к началу мероприятия, свободного места в зале я найти не мог: сотни две молодых программистов (средний возраст около 25 лет) уже заняли не только расставленные, но и наспех позаимствованные из соседнего кафе стулья.
«Ребята, вы собрались в правильное время! — начал свой телемост-разговор с аудиторией Николай Давыдов (инвестиционный фонд Gardian Capital). — Мы инвестируем во все, что так или иначе связано с искусственным интеллектом — в машинное обучение, глубокое обучение, большие данные. Наш бизнес напрямую зависит от точности прогноза, поэтому говорю с большой долей уверенности: нейронные сети и искусственный интеллект — это ворота в будущее. В XX веке люди научили компьютеры решать простые счетоводческие задачи. Теперь пришло время более сложных машинных задач — в области генной инженерии, роботизированной хирургии, медицинской диагностики и создания новых лекарств. На очереди — автоматизация журналистики и юриспруденции, профилактика правонарушений и „умные“ контракты».
Он привел данные аналитической компании Quid, согласно которым искусственный интеллект за последние пять лет привлек более 20 млрд. долл. А TechSciResearch прогнозирует рост рынка производства продукции с искусственным интеллектом к 2018 г. до 37 млрд. долл.
«Сегодня дата-сайентист — одна из самых высокооплачиваемых профессий. Огромное количество специалистов по ИИ приходится на постсоветские страны — Россию, Украину, Белоруссию. Эти три страны выпускают по
По его данным, в 2016 г. IBM приобрела 14 ИИ-стартапов, Google — 12, Microsoft — 9, Facebook — 8 и Amazon — 4.
«Сегодня проблема дата-сайентистов — в том, что они мало общаются с представителями предметных областей бизнеса. А потом еще оказывается, что не всегда достаточно собрать их в одном офисе: важно, чтобы они научились понимать друг друга и работать над решением общей задачи. Вот с этим во всем мире большие трудности. Дефицит предметных знаний у дата-сайнтистов приводит к тому, что технологии нейросетей все больше проскакивают мимо реальных задач и заворачивают в сферу развлечений. Появляются огромное количество аттракционов типа „Маскарада“ или „Призмы“. Но я призываю всех, кто собирается заниматься искусственным интеллектом: не идите в развлекуху! Ищите применение в медицине, сельском хозяйстве, генной инженерии, строительстве. Вникайте, как устроен их бизнес и какие конкретно проблемы стоят в их предметной области. Тогда вы будете знать, что там можно автоматизировать и ускорять и как получать потрясающие бизнес-результаты», — призвал Николай Давыдов.
Он привел пример некой медицинской лаборатории, которая проводит тесты на наличие у пациентов различных возбудителей болезней. «Анализы занимают очень много времени. Почему? Потому что их проводят люди, которые смотрят в микроскоп. А теперь мы монтируем в микроскоп веб-камеру, она делает снимки, передает их в дата-центр, и оттуда мгновенно возвращается результат. После внедрения новинки пропускная способность лаборатории — уже не 10 человек в день, а 10 тыс. А стоимость анализа — не 5 тыс. долл., а всего пять. И рынок становится гигантским, даже в Африке люди могут позволить себе сделать такой тест. Вот за счет таких проектов и ожидается, что в мировой экономике появятся десятки миллиардов новых долларов. Мы стараемся идти этим путем. Недавно мы провели встречу с представителями нескольких крупных корпораций, которые выращивают сельхозкультуры. Подумали-подумали вместе — а давайте возьмем снимки полей со спутников и сопоставим с тем, в каком году какой был с каждого поля урожай. Вот уже и основа для прогнозирования! Просто? Просто! Давайте усложним и запустим исследование: какой квадратный метр какого поля каким удобрением нужно поливать?», — рассказал Николай Давыдов.
По его словам, 90% всех накопленных человечеством данных введены в информационные системы в течение последних двух лет. При этом 80% данных являются неструктурированными. «Человечество собрало неимоверное количество данных про все на свете, и теперь не знает, что с ними делать». — отметил он.
На вопрос, что произойдет быстрее — предметник освоит работу с нейросетями или дата-сайентист станет экспертом в предмете, Николай Давыдов ответил категорически: оба пути тупиковые! «Математик, хорошо разбирающийся в искусственном интеллекте, чтобы освоить до нужной детализации предметную область, должен потратить 10 лет жизни. Ему это нужно? Равно как и продвинутый эксперт-предметник не станет переучиваться 10 лет на математика. Нет, здесь нужно другое: создавать команды и внутри них искать и находить взаимопонимание на уровне универсальных основ и высоко абстрактных концепций — и о том, какие проблемы стоят в той или иной предметной области, и том, как работает искусственный интеллект», — уверен он.
Практически о той же проблеме, но в ином развороте, рассказал Александр Сербул («1С-Битрикс»). «Глубокое обучение застало программистов врасплох, — признался он. — Оказалось, почти все они плохо знают математику. А без математики в обучении нейронных сетей — ну никак! Беда в том, что большинство математиков, как правило, ничего не понимают в программировании, а большинство разработчиков — полные нули в математике». В доказательство своих тезисов он провел небольшое социологическое исследование и был посрамлен: оказалось, что 99% из присутствующих пишут код. И около половины из них понимают смысл терминов «скалярное произведение векторов», «теория вероятности» и «линейная алгебра». И тем не менее, проблема есть, и проблема серьезная. Просто, похоже, выборка оказалась смещенной: в зале собрались наиболее любознательные и продвинутые юноши и девушки из столичной индустрии data science.
«Глубокое обучение нейросетей — это очень хороший, достойный вызов для математиков, разработчиков и аналитиков. Наша сила — в единстве! Призываю всех и в первую очередь себя — учиться обмениваться знаниями и искать синергию математиков и программистов!», — закончил свое выступление Александр Сербул.