Первое, о чем вспоминается – это 12 технологических тенденций развития ИТ, которые выделили аналитики Gartner на 2022-2023 годы. Однако, не все знают, что аналитики Gartner выделяют более «широкие» тенденции, направления развития компаний, опирающиеся на новейшие технологические достижения. В 2023 году они выделили три направления:
- расширение иммерсивного опыта;
- расширение направлений внедрения искусственного интеллекта;
- оптимизация работы ИТ-отделов внутри компаний за счет технических решений.
В этой части статьи мы поговорим о тенденциях и проблемах использования искусственного интеллекта.
За последнее десятилетие искусственный интеллект превратился из сугубо научного направления в силу, приводящую в движение бесчисленное множество отраслей и влияющую на жизнь миллионов людей каждый день. Чем же сейчас живет эта область, каковы текущие тенденции и проблемы?
Они не умные, просто много запомнили
Первая распространенная тенденция, о которой стоит сказать – это отношение к нейросетевым моделям, как к разумным. В последние годы удалось создать системы искусственного интеллекта, которые могут учиться на поистине громадном количестве примеров для нахождения новых решений проблем разных видов и сложности. Большие языковые модели (LLM) привели к созданию систем, которые способны понимать человеческие язык и письмо, которые мы используем каждый день, от цифровых помощников до программ преобразования речи в текст. Другие генеративные модели, обученные распознавать работы известных художников или научную литературу, позволили нам создавать новые произведения искусства или новые идеи для использования в научной среде.
В результате, нам порой кажется, что ChatGPT умный и знает ответы на все вопросы, даже на те, которые вы никогда никому не задавали. Но это ошибочное ощущение, скорее всего, он просто скомпилировал данные, которые где-то видел.
Вопреки расхожему мнению, интеллект у машин отсутствует, зато есть огромный потенциал хранения и обработки данных. В отличие от человека, машина способна обрабатывать колоссальные объемы данных и выявлять связи, на поиск которых человеку необходимы часы и дни. Именно на этом и сфокусировались разработчики искусственного интеллекта и уделяют сегодня наибольшее внимание.
Определенные архитектуры нейронных сетей, такие как GPT, очень хорошо запоминают данные. Вкупе с обучением на огромных корпусах данных, которое ранее нам было недоступно, и создается впечатление разумности.
Базовые нейросетевые модели
В последние пару лет на рынке появились нейросетевые модели, уже обученные на широком наборе неразмеченных данных. Они называются «базовыми» или «основными» моделями, так как на их основе можно строить прикладные и узкоспециализированные нейросети для различных сфер применения.
Такая модель способна применять информацию, полученную в одной ситуации, к другой (эффект переноса). В результате, эти базовые нейросетевые модели можно использовать для различных задач с минимальной последующей настройкой. Да, на сегодня объем изученных нейросетью данных значительно больше, чем требуется среднестатистическому человеку для переноса его опыта с одной задачи на другую. Однако конечный результат, по большей части, одинаков: и человек, и искусственный интеллект получат навык решения задач в новой области.
Первыми яркими примерами стали модели GPT-3, BERT и DALL-E 2, показавшие возможность обучения искусственного интеллекта на широкой информационной базе без специальной маркировки (мы писали об этом в статье «Нейросети для бизнеса. Часть 2. Что надо знать руководителю?»). В качестве примера использования таких моделей можно привести многочисленные проекты, работающие с естественными языками. В предыдущем поколении методов искусственного интеллекта для построения нейросетевой модели, которая была бы способна обобщать текстовые фрагменты, требовались десятки тысяч размеченных примеров, только для одного варианта обобщения.
Таким образом, предварительно обученная базовая модель значительно сокращает требования к данным, необходимым для создания нейронной сети под конкретную прикладную задачу. И, что не менее важно, меняет логику работы с нейросетевыми моделями и сокращает затраты времени и ресурсов.
- Базовая модель предметной области универсальна и может использоваться для многих задач, в отличие от предыдущих технологий, которые требовали создания моделей с нуля в каждом случае. Создание и настройка каждой новой ИИ-модели требовали значительного количества времени и ресурсов. Для каждого нового варианта использования нейросетей необходимо убедиться, что имеется большой, хорошо помеченный набор данных для конкретной задачи (к слову, специалисты говорят, что хороших наборов данных нет, есть удовлетворительные и неудовлетворительные). Если необходимого набора данных нет, то приходилось тратить тысячи часов на поиск и маркировку подходящих изображений, текста или графиков для формирования модели.
- Можно дообучить модель работе с информацией из конкретной области, например, относящейся к компании, используя гораздо меньший объем размеченных данных, потенциально всего несколько тысяч размеченных примеров.
А значит гораздо больше компаний смогут использовать технологии нейросетей, решая более широкий диапазон задач.
Причинно-следственный искусственный интеллект
Еще одна из важных тенденций, связанных с искусственным интеллектом, – это причинно-следственный искусственный интеллект (Causal AI).
По сути это попытка приблизить искусственный интеллект к тому, как мыслит человек и выйти за рамки статистических предсказаний на основе машинного обучения, как это происходит в сегодняшних нейросетях. Это стремление создать технологию, которая будет способна рассуждать и делать выбор, как это делают люди. И тогда ее можно будет напрямую интегрировать в процесс принятия решений человеком.
У причинно-следственного искусственного интеллекта три важные отличия от традиционного.
- Истинный потенциал искусственного интеллекта заключается в том, чтобы дать людям возможность принимать более взвешенные решения за счет анализа причинно-следственных связей, имеющихся в определенной ситуации. Технологии машинного обучения всегда были направлены на предсказание чего либо, например, следующего слова в тексте (мы писали об этом в статье «Нейросети для бизнеса. Часть 2. Что надо знать руководителю?»). Причинно-следственный искусственный интеллект также может предсказывать, но, что важнее, он может сделать еще один шаг, позволяя ответить на вопросы, вида: «Каков будет эффект от изменения в определенной входной переменной или параметра?» или «Каков наиболее эффективный способ действия в ситуации?». Традиционные нейросетевые модели не могут ответить на эти вопросы. Это открывает перед нами совершенно новые возможности моделирования ситуаций, например, оценки методов лечения.
- Ключевое требование бизнеса – искусственный интеллект должен соответствовать юридическим и этическим требованиям, а самое главное, должен быть объяснимым. Однако нейросетевые модели – это черные ящики, и попытки объяснить их пока не удаются (об этом читайте ниже, в разделе «Современные проблемы нейронных сетей»). Причинно-следственный искусственный интеллект нацелен на создание удобных и прозрачных для человека нейросетевых моделей. Люди смогут тщательно изучить и изменить предположения, лежащие в основе моделей, до того, как они приведут к каким-либо выводам и прогнозам. То есть мы понимаем, что именно делает модель, и насколько разумны будут результаты.
- Причинно-следственный искусственный интеллект будет управляем. Эксперты могут использовать свои уникальные знания об исследуемой области, могут определить конкретные взаимосвязи и их форму. Таким образом, причинно-следственные модели объединяют в себе лучшее из опыта экспертов и подходов, основанных на данных.
Несмотря на все достоинства, в сравнении с искусственным интеллектом предыдущего поколения, причинно-следственный искусственный интеллект на данном этапе своего развития является достаточно дорогостоящим проектом. Для обучения необходимо организовать постоянный поток данных, как правило, из разных источников, чтобы создать более-менее релевантную причинно-следственную модель. Это означает необходимость комплексной цифровизации предприятия в любой сфере, где используется искусственный интеллект. Это существенная проблема для отечественного рынка, где общий уровень цифровизации экономики, хоть и растет из года в год, но все же остается достаточно низким.
Современные проблемы нейронных сетей
Переходим к проблемам технологий искусственного интеллекта, в частности, нейронных сетей. Каждому, кто планирует использовать или экспериментирует с нейросетями, стоит знать о пяти наиболее острых проблемах.
- Нет понимания, как они работают. К сожалению, сегодня у нас нет хорошего и четкого понимания того, что происходит внутри нейронных сетей. Большинство текущих теоретических моделей, которые описывают происходящее внутри таких сетей, основаны на двухслойных линейных моделях, что довольно примитивно. Такие методы, как LIME или SHAP, дают некоторое (ограниченное) объяснение, однако, их можно использовать только с уже обученными моделями. И они не могут гарантировать, что модель всегда будет действовать разумно, поскольку пытаются объяснить прошлую ситуацию. SHAP и Lime только объясняют прошлое, но не пытаются предугадать, что модель может сделать в будущем. И сегодня нет никакой гарантии, что вывод модели будет иметь смысл в будущем. Например, галлюцинации (а любая модель на основе машинного обучения галлюцинирует) возникают, когда модель пытается экстраполировать выводы за пределы обучающих данных.
Теоретическое понимание нейронных сетей сегодня значительно отстает от практики, возникает много новых методов, которые работают, однако, почему они работают, как работают и какие это влечет проблемы, никто не понимает.
- Этические проблемы. Также актуальны этические проблемы, связанные с использованием нейронных сетей. Дело в том, что большинство современных обученных нейросетей «из коробки» оказываются расистскими и сексистскими. Причина -- мир такой, мы сами такие. обучение на недостаточно очищенных данных. Эти данные берутся из интернета как есть. Мы обучаем нейронные сети на данных, которые составлены из наших же текстов, которые мы сами пишем. И, к сожалению, оказывается, что все наши проблемы, в том числе расизм и сексизм, переходят в нейросети.
- Уязвимость для атак. Нейронные сети оказались очень уязвимы для различных видов атак. Очень-очень сложный механизм нейронной сети, как выяснилось, несложно сломать. Самый известный пример: нейросети показывали фото панды, потом в изображение панды добавили небольшой шум, и модель решила, что это гибон. Появился даже специальный термин Adversarial Machine Learning (AML), который переводят как «состязательное машинное обучение». Под этим подразумевается целенаправленное воздействие на нейронную сеть, которое способно вызвать ошибки в ее поведении. Первые публикации относятся еще к 2004 году. Но в 2013 году инженеры из Google AI, пытаясь понять, как нейросети «думают», обнаружили общее свойство ML-метода: их легко обмануть небольшими возмущениями.
Как сделать нейронные сети неуязвимыми? Пока, к сожалению, никак. Эта проблема требует серьезного внимания и разработки эффективных механизмов защиты от потенциальных угроз.
- Доверие к нейросетям. Нейросети оказались неустойчивы к сознательным воздействиям и обману, в результате, через нейросети можно управлять толпой. Это поднимает вопросы корректности и безопасности использования нейросетей для построения рекомендательных систем и других приложений. Ведь рекомендательные системы, используемые YouTube, Google и Яндексом, используют нейронные сети. Как сделать рекомендательные системы честными? Сейчас использование нейронных сетей для решения прикладных задач ограничивается системой подсказок, но при этом, принятие решений не отдается нейросетям полностью, всё равно решение принимает человек.
- Монополия на вычислительные мощности. Для обучения современных моделей требуется большая вычислительная мощность и ресурсы, которыми обладают далеко не все. Современные модели – это модели с огромным количеством параметров и для их обучения нужен не просто хороший суперкомпьютер, нужны целые комплексы таких суперкомпьютеров с мощными видеокартами. Например, мощности машин, которыми обладают специалисты Сколковского института, не сравнятся с тем, чем владеет OpenAI, Google или Facebook. Если мы посмотрим на работы, которые сейчас появляются в области нейросетей, на технологии, которые появляются, это все результаты команд больших корпораций. Крупные корпорации обладают нужными вычислительными мощностями, а значит развитие инноваций в этой области будет двигаться ими.
Доступ к вычислительным ресурсам, необходимым для обучения и разработки нейронных сетей, остается ключевым фактором, и если он не будет решен, то перекос в развитии нейронных сетей неизбежен.
***
Итак, на данный момент преждевременно говорить о появлении разумных моделей. О чем-то, похожем на SkyNet, даже мечтать не стоит. Более того, перспективы использования нейросетевых моделей в бизнесе сейчас связываются с разработкой причинно-следственного искусственного интеллекта. И для наиболее успешного и эффективного функционирования таких технологий предприятию необходимо свести в единый поток информацию из разных источников и унифицировать ее хотя бы минимально.
Чтобы оставить комментарий пожалуйста Авторизуйтесь