Сделать интеллект говорящим

Независимый обозреватель. На протяжении 15 лет был обозревателем, затем — заместителем главного редактора, а впоследствии занял пост главного редактора журнала Intelligent Enterprise.

Использование технологий искусственного интеллекта в бизнесе начинается с простых и понятных ситуаций — голосовых и текстовых помощников, или чатботов (chatbots). Есть заметные успехи: уже работают чатботы первого поколения, однако они умеют далеко не всё. На данный момент активно идет техническое совершенствование более продвинутых диалог-ориентированных чатботов, задачи которых выходят за рамки простых сценариев. Однако какие требования к ним предъявлять и что они смогут, пока до конца неясно. Это только начало, нам еще предстоит провести классификацию таких решений, уловить важные нюансы и ответить на многие вопросы. Первые шаги на этом пути мы и сделаем в этой статье. Во второй части статьи мы поговорим о чатботах с «широким кругозором», ориентированных на полноценный диалог с пользователем.

Чатботы с «широким кругозором»

В настоящее время активно совершенствуются технически более продвинутые чатботы, задачи которых выходят за рамки простых сценариев, описанных в первой части статьи. Говоря простым языком, речь идет о переходе от упрощенных сценариев взаимодействия в стиле «вопрос-ответ» к полноценному диалогу между чатботом и человеком, осуществляемому в течение определенного периода времени как раз посредством того самого Dialog management. Здесь, как минимум, система должна быть в курсе предшествующей истории взаимоотношений и уметь осуществлять запросы дополнительной информации (slot filling), при этом не только той, которой явно недостает в связи с непосредственно заданным пользователем вопросом. Чатбот также должен быть в состоянии сам предложить расширенный ответ на вопрос, зная, что некоторые смежные, но, возможно, не имеющие прямого отношения к запросу данные, в системе имеются. В примере с заказом авиабилета это может быть, скажем, предупреждение о том, что в аэропорту прибытия в интересующее клиента время ожидается сильный снегопад, о чем клиент вроде бы и не спрашивал. Система также должна уметь сама инициировать беседу, если того требует ситуация.

Задача продвинутых чатботов — переход от упрощенных сценариев взаимодействия в стиле «вопрос-ответ» к полноценному диалогу между чатботом и человеком, учитывающему историю взаимоотношений, расширение тем обсуждения и широкий контекст взаимодействия.

Речь все чаще идет об ее способности успешно справляться (по крайней мере в определенных пределах) с изменением контекста взаимодействия (context switching). Опять-таки, возвращаясь в хрестоматийному примеру с авиакомпанией, не боясь показаться отвлеченным футурологом, можно уже говорить о чатботах, которые помогут не только купить билет на интересующее направление, но и сделать сопутствующие заказы (в том числе по инициативе чатбота) — забронировать гостиницу, арендовать авто, заказать гида-переводчика и пр. Также необходимо уловить момент, когда собеседник чатбота закончил с формальными моментами и начал интересоваться информацией о достопримечательностях в предполагаемом месте пребывания, погодных условиях, о проведении там значимых мероприятий и интересуемый период времени и т. д. Все это и есть смена контекста, и подобные сервисы (при наличии, конечно, соответствующей информации) чатбот должен уметь предоставить. Пока это еще не общепринято, но очень скоро станет обязательным для чатботов с «широким кругозором».

Инструменты и компетенции

Еще раз вернемся к инструментам и квалификациям, на сей раз связанным с построением диалог-ориентированных чатботов. Опуская многочисленные нюансы, отметим лишь то, что ключевую роль в чатботах с «широким кругозором» играет одна из составляющих — так называемое «управление диалогом с пользователем» (Dialog Management). Эти методы и технологии всегда считались классическим компонентом, лежащим в основе чатботов. Однако потребности здесь могут выходить за рамки API. Поэтому за последние два-три года интенсивная интеллектуализация диалога с пользователем сформировала еще одно направление — так называемые платформы коммуникативного искусственного интеллекта (Conversational AI), или искусственного интеллекта для диалога. Безусловно, все это не в последнюю очередь вопрос терминологии и маркетинга программных решений, но тем не менее.

Потребность в бизнес-аналитиках здесь очевидна. Считается, что в рассматриваемом случае формируются целые команды из экспертов разных направлений бизнеса, из различных коммерческих и даже государственных предприятий. Роли программистов и Data Scientists, естественно, сохраняются. Примечательно также, что в отличие от более простых сценариев, в случае внедрения диалогово-ориентированных речевых систем появляется потребность в ИТ-архитекторах.

От NLP до Dialog Management – эволюция решаемых задач, продуктов, функций и специалистов

От NLP до Dialog Management — эволюция решаемых задач, продуктов, функций и специалистов

API-экономика

Важно понимать, какие тренды формируют практическую потребность в чатботах с «широким кругозором». Прежде всего, это вызвано движением к так называемой API-экономике (API economy), или иными словами, такой глобальной бизнес-среде, при которой большинство бизнес-компаний, некоммерческих структур и государственных организаций имеют возможность доступа к своим ИТ-ресурсам через программный интерфейс API. Логика проста — вкладываться в организацию полноценного диалога с помощью речевых технологий бессмысленно, если мы имеем доступ лишь к корпоративной системе и, соответственно, можем предложить клиенту лишь товары из собственного каталога и больше ничего. При самом высоком интеллекте чатбота полноценного диалога здесь, очевидно, не может получиться.

Другое дело, если мы можем в реальном времени «подтягивать» необходимые в конкретный момент диалога данные из очень широкого набора внешних источников, включая зарубежные. Если, предположим, чатботы, через API, могут получать данные с GPS-приемника собеседника, с персональных носимых или медицинских устройств, знать о его последних покупках и т. д., то всё коренным образом меняется.

Вкладываться в организацию полноценного диалога бессмысленно, если мы имеем доступ лишь к корпоративной системе и можем предложить клиенту лишь собственные товар. При самом высоком интеллекте чатбота полноценного диалога здесь не получиться.

В большей степени в использовании чатботов с «широким кругозором» продвинулись муниципальные власти крупных городов, претендующих на то, чтобы относиться к категории «умных» (smart cities). В них, как правило, хотя бы частично реализована пресловутая концепция открытых данных (open data). Она, в свою очередь, материализует идеи API-экономики, представляя посредством стандартных программных интерфейсов доступ к множеству городских информационных ресурсов. И формирование диалог-ориентированных чатботов в данном случае, по сути, лучший способ раскрыть потенциал этих данных и показать, что город реально является умным. В некоторых городах Европы и Америки (Копенгаген, Чикаго, Филадельфия, Стокгольм) подобные сервисы уже реализуются. С их помощью можно не столько задать вопрос, а скорее поговорить с чатботом, скажем, на темы городской безопасности, экологической обстановки, проблемах эксплуатации и развития городской системы общественного транспорта и т. д.

В бизнесе продвинутые чатботы, несмотря на явную перспективу, пока отвоевывают свое место с трудом. Отчасти это связано с нежеланием независимых бизнесов взаимно делиться своими ИТ-ресурсами.

Роботизация бизнес-процессов

Вторая тенденция, влияющая на развитие диалоговых функций чатботов, — это рост направления роботизации бизнес-процессов (Robotic process automation, RPA) . Речь здесь, в основном, идет об организации интерфейса между «зашитыми» внутри процессов программными роботами и сотрудниками, вовлеченными в процесс. Такие чатботы можно трактовать и как инструмент взаимодействия «человек-процесс» (а не «человек-машина»), и как средство коллективного взаимодействия сотрудников, но не напрямую, а через тот же самый роботизированный процесс. На процессы, как известно, в реальном времени оказывают влияние всевозможные исключения и действия иных сотрудников. Изменение процессов может повлиять на работу смежных служб предприятия, и таким образом речевой интерфейс с развитыми диалоговыми возможностями оказывается весьма востребованным.

Однако технология RPA, несмотря на очень мощную раскрутку, проникает в бизнес, мягко говоря, не без проблем. Примеры ее бизнес-применения найти можно, но они немногочисленны.

Чатботы первого поколения функционально были больше ориентированы на продажи. По мере зрелости технологий к практическому применению, ими начинают все больше интересоваться. маркетологи из самых разных отраслей. А для них диалог с потребителем играет ключевое значение.

Перспективы использования чатботов второго поколения

Чатботы первого поколения функционально были больше ориентированы на продажи, и уже не раз упомянутый пример с реализацией авиабилетов яркое тому подтверждение. В этой сфере даже без чатботов взаимодействие продавец-покупатель традиционно строилось довольно прямолинейно, без детального учета его истории и каких-либо особых смысловых нюансов. Другое дело сфера маркетинга. По мере зрелости технологических разработок и большей готовности диалог-ориентированных чатботов к практическому применению, ими начинают все больше интересоваться. маркетологи из самых разных отраслей. А для них диалог с потребителем играет ключевое значение. Они могут, скажем, интересоваться корреляцией продаж различных товаров, тем, почему покупатель покидает магазин не в лучшем настроении, и задавать массу подобных вопросов, которые в сфере продажах зачастую не возникают.

Соответственно, потребность в полноценных роботизированных диалогах, в интеграции данных, которые, по сути, эти диалоги питают, становится более явной. Попутно возникают новые направления, подобные, скажем, оценке эмоционального состояния собеседника (Sentiment Analysis), которые, кстати, в отличие от многих других компонентов обработки речи, развиваются самостоятельно в ситуациях обработки текста и голоса. И таким образом речевые интерфейсы должны будут становиться богаче и разнообразнее.

* * *

В заключение отмечу, что если интерес пользователя к речевым технологиям сосредотачивается на Enterprise-сегменте, а не сценариях домашнего применения, следует ориентироваться не на то, как внедряются пресловутые цифровые помощники (наподобие Apple Siri, Amazon Alexa или Яндекс.Алиса). Следует пристально наблюдать за развертыванием речевых технологий в контакт-центрах и на электронных торговых площадках. Там есть место фактически любым имеющимся на сегодня продуктам речевого взаимодействия. Бизнес-процессы в компаниях такого профиля часто отработаны до автоматизма и неплохо поддаются количественному измерению различными KPI. Отработаны они настолько детально, что работники контакт-центров, занимающихся исходящими звонками, едва ли не сами больше начинают напоминать роботов. Здесь, если какая-либо система и начинает внедряться, можно быть уверенным, что в самой ближайшей перспективе речь пойдет об ее промышленном использовании и что экономический эффект уже детально оценен.

© «УПРАВЛЯЕМ ПРЕДПРИЯТИЕМ»
Все права защищены. Все торговые марки являются собственностью их правообладателей.