Поскольку алгоритмы искусственного интеллекта испытывают трудности с метапознанием или метакогнитивными процессами и пониманием причинно-следственных связей, важно, чтобы их снабжали правильными данными, пишет на портале ComputerWeekly известный специалист в области программной инженерии, компьютерной безопасности и распределенных систем Джунаде Али.

Природа человеческого познания до сих пор ускользала от всех, от философов до нейробиологов. Поэтому неудивительно, что формирующийся сегодня ИИ ограничивается лишь базовым распознаванием образов в наборах данных. Хотя алгоритмы ИИ и машинного обучения (МО) становятся все лучше, делая все больше с минимальными усилиями, нам все еще часто приходится объединять данные из нескольких источников, чтобы получить имеющие смысл результаты. Чтобы разобраться с различными ситуациями, которые возникают в реальном мире, человеку требуется много информации, что уж говорить о примитивных компьютерных алгоритмах — для этого им требуется гораздо больше информации.

Всего можно выделить две важные технологии, которые сыграют огромную роль в будущем МО, но в настоящее время они относительно мало изучены — метапознание и причинно-следственные связи. Люди наделены способностью не только выполнять когнитивную задачу, но и обдумывать свои мысли в ходе выполнения. Хотя ученые-бихевиористы утверждают, что наше эго иногда мешает нам делать это рационально, этот процесс остается критически важным для обучения людей. Он известен как метапознание. В ходе обучения люди планируют, контролируют и оценивают уровень своего познания. Настолько, что, наблюдая за тем, как робот-пылесос работает неправильно, это нас забавляет, что также является частью метапознания.

Несколько лет назад мне довелось работать над решением именно этой проблемы. Мне потребовалось сделать алгоритм обработки естественного языка (Natural Language Processing, NLP) чувствительным к риску совершения ошибки. По сути, алгоритм NLP обрабатывал текст и придумывал подходящий ответ для человека, а другая нейронная сеть принимала бинарное решение о том, приведет ли этот ответ к положительному взаимодействию. Эту область также изучали и другие ученые, и в настоящее время ведутся исследования, направленные на разработку новых способов более продвинутого метапознания в ИИ, направленного на повышение уровня понимания машин.

Другой проблемой для ИИ является способность алгоритмов понимать причинно-следственные связи. Пока что большая часть их работы сводится к поиску корреляций между точками данных, а не к их пониманию.

Одним из научных способов понимания причинно-следственных связей являются рандомизированные контрольные испытания (Randomised Control Trials, RCT), в которых испытуемые случайным образом распределяются по различным группам. Такие испытания используются в самых разных областях — от разработки вакцин до A/B-тестирования различных дизайнов пользовательских интерфейсов на веб-сайтах. RCT являются одной из самых высоких форм научного доказательства и обеспечивают значительно большую достоверность, чем данные наблюдений, однако для получения статистической достоверности может потребоваться большое количество данных, и с самого начала необходима тщательная проработка эксперимента.

Когда речь идет о данных, совершенствование причинно-следственных связей в ИИ дает возможность делать больше с меньшими усилиями. Microsoft Research — одна из команд, которая в настоящее время работает над их улучшением в ИИ, но предстоит еще много работы. Пока ИИ еще не научился находить их, и интеграция данных будет оставаться важной частью снабжения ограниченных в возможностях алгоритмов МО теми данными, которые им нужны для получения правильных выводов.

Речь идет не только об объеме данных, но и об их размерности. Алгоритмам МО необходимо полное понимание всех атрибутов данных, чтобы у них было больше шансов прийти к правильным выводам. По этой причине, прежде чем примкнуть к ИИ-революции, вы должны убедиться, что ваши данные в порядке.