Демократизация данных является одним из главных приоритетов для многих предприятий, пишет на портале Datanami Ади Ход, соучредитель и генеральный директор компании Velotix.
Когда сотрудники имеют свободный доступ к данным, они могут быстрее принимать решения, лучше сотрудничать и получать важные инсайты. Компании по всему миру все больше осознают, насколько ценными могут быть их данные, но многие из них используют менее половины своих данных, поскольку не имеют эффективного способа доступа к ним.
Предприятия пытаются сделать данные доступными и при этом защитить конфиденциальную информацию. Новые угрозы безопасности создают препятствия для доступа к данным, что тормозит их открытие для всех. Вот несколько примеров того, как эти угрозы безопасности ограничивают возможности предприятий по максимальному использованию своих данных:
1. Угрозы безопасности от генеративного ИИ
Несмотря на то что генеративный ИИ открывает совершенно новые горизонты возможностей, он также представляет значительные риски для организаций, угрожая безопасности и конфиденциальности служебных данных. Несколько случаев утечки данных из ChatGPT, зафиксированных в этом году, вызывают опасения, что технологии ИИ подвержены кибератакам. Поскольку ChatGPT нельзя загрузить, а доступ к нему осуществляется через веб-браузер, конфиденциальная информация или данные пользователей, хранящиеся в журналах разговоров, могут стать достоянием хакеров.
Каждый раз, когда пользователь вводит данные в подсказку ChatGPT, эта информация попадает в большие языковые модели (LLM) сервиса, используемые для обучения следующей версии алгоритма обработки языка. При отсутствии должной защиты информация может быть получена неавторизованными лицами. Предприятия пытаются найти способы использования возможностей этого инструмента, не увеличивая при этом риск утечки данных.
2. Обнаружение всех данных
Фактический объем данных в организации зачастую намного больше, чем предполагалось, и может меняться от минуты к минуте. На смену инфраструктурам данных, обеспечивающим потребление, хранение, преобразование и вывод данных в одном центральном хранилище, приходят многочисленные хранилища данных, конвейеры, частные и внешние облака, поэтому выявление всех различных источников данных превращается в сложнейшую задачу. Поскольку инфраструктура данных становится все более сложной, предприятиям все труднее определить, какими данными они располагают, где они находятся и кому должен быть предоставлен доступ. Компаниям необходимо оценить потребности в управлении продуктами данных, управлении данными, использовании платформ данных и способах управления бизнес-доменами в экосистеме данных.
3. Быстро меняющееся законодательство в области конфиденциальности данных
Компании по всему миру сталкиваются с меняющимся нормативным ландшафтом и новыми обязанностями по обеспечению соответствия. Огромный объем и сложность нормативных актов представляют собой одну из наиболее острых проблем, связанных с обеспечением соответствия нормативным требованиям.
Кроме того, отдельные бизнес-подразделения в рамках организации могут подчиняться собственным нормативным актам или отраслевым стандартам соответствия. Глобальные компании вынуждены следовать государственным, федеральным и международным нормам, регулирующим конфиденциальность данных. Более 130 стран имеют собственное законодательство в области конфиденциальности данных. Компании, которые пытаются соблюдать каждый нормативный акт в отдельности, могут быстро оказаться перегруженными.
4. Отсутствие ответственности за соблюдение требований и конфиденциальность данных
Защита персональных данных может входить в компетенцию отдела безопасности, ИТ-отдела, юридического отдела, группы по соблюдению нормативных требований или всех вышеперечисленных подразделений, что требует высокой степени прозрачности и взаимодействия. К сотрудникам, отвечающим за безопасность данных, относятся инженеры по данным, аналитики, инженеры-аналитики, специалисты в области науки о данных, менеджеры продуктов, бизнес-аналитики, нетехнические специалисты по исследованию данных и др. Кроме того, при хранении данных в облаке ответственность разделяется между организацией, провайдером облака и всеми его пользователями, что повышает риск ошибок и недопонимания, которые могут привести к потере данных.
5. Мониторинг и отслеживание использования данных
Сегодня для подтверждения соответствия требованиям необходимо собирать, хранить и анализировать дополнительную информацию о том, как осуществляется доступ к данным и их использование. Учитывая огромное количество данных, используемых для бизнес-анализа, эта задача становится все более сложной. Сюда входит контроль всех действий, выполняемых над данными пользователями, таких как запрос, анализ, создание отчетов или экспорт. Необходимо отслеживать информацию, хранящуюся в каталогах данных, историю данных, качество данных, аналитику данных и оповещения о данных. Во многих случаях предприятия должны хранить соответствующие данные, связанные с аудитом, в течение нескольких лет, в зависимости от типа нормативных требований. Большинству организаций требуется хранить и обрабатывать эти данные, что создает нагрузку на инфраструктуру и дополнительные задачи для команд, отвечающих за соблюдение нормативных требований.
Изучение больших данных с целью выявления закономерностей, корреляций, рыночных тенденций и предпочтений клиентов становится обязательным для большинства предприятий. В условиях все более сложного ландшафта данных и динамичной нормативно-правовой базы организациям необходимо внедрять эффективное управление данными. Быстрые темпы изменений, растущие объемы данных и новые технологии создают дополнительные сложности, требующие более совершенных средств управления доступом к данным. Интеллектуальная автоматизация может соответствовать темпам работы динамичных команд, нормативным требованиям и политике конфиденциальности, обеспечивая сотрудникам возможность получать данные, необходимые для повышения качества бизнес-анализа, а компаниям — соответствие нормативным требованиям.