Чатботы с «широким кругозором»
В настоящее время активно совершенствуются технически более продвинутые чатботы, задачи которых выходят за рамки простых сценариев, описанных в первой части статьи. Говоря простым языком, речь идет о переходе от упрощенных сценариев взаимодействия в стиле «вопрос-ответ» к полноценному диалогу между чатботом и человеком, осуществляемому в течение определенного периода времени как раз посредством того самого Dialog management. Здесь, как минимум, система должна быть в курсе предшествующей истории взаимоотношений и уметь осуществлять запросы дополнительной информации (slot filling), при этом не только той, которой явно недостает в связи с непосредственно заданным пользователем вопросом. Чатбот также должен быть в состоянии сам предложить расширенный ответ на вопрос, зная, что некоторые смежные, но, возможно, не имеющие прямого отношения к запросу данные, в системе имеются. В примере с заказом авиабилета это может быть, скажем, предупреждение о том, что в аэропорту прибытия в интересующее клиента время ожидается сильный снегопад, о чем клиент вроде бы и не спрашивал. Система также должна уметь сама инициировать беседу, если того требует ситуация.
Речь все чаще идет об ее способности успешно справляться (по крайней мере в определенных пределах) с изменением контекста взаимодействия (context switching). Опять-таки, возвращаясь в хрестоматийному примеру с авиакомпанией, не боясь показаться отвлеченным футурологом, можно уже говорить о чатботах, которые помогут не только купить билет на интересующее направление, но и сделать сопутствующие заказы (в том числе по инициативе чатбота) — забронировать гостиницу, арендовать авто, заказать гида-переводчика и пр. Также необходимо уловить момент, когда собеседник чатбота закончил с формальными моментами и начал интересоваться информацией о достопримечательностях в предполагаемом месте пребывания, погодных условиях, о проведении там значимых мероприятий и интересуемый период времени и т. д. Все это и есть смена контекста, и подобные сервисы (при наличии, конечно, соответствующей информации) чатбот должен уметь предоставить. Пока это еще не общепринято, но очень скоро станет обязательным для чатботов с «широким кругозором».
Инструменты и компетенции
Еще раз вернемся к инструментам и квалификациям, на сей раз связанным с построением диалог-ориентированных чатботов. Опуская многочисленные нюансы, отметим лишь то, что ключевую роль в чатботах с «широким кругозором» играет одна из составляющих — так называемое «управление диалогом с пользователем» (Dialog Management). Эти методы и технологии всегда считались классическим компонентом, лежащим в основе чатботов. Однако потребности здесь могут выходить за рамки API. Поэтому за последние два-три года интенсивная интеллектуализация диалога с пользователем сформировала еще одно направление — так называемые платформы коммуникативного искусственного интеллекта (Conversational AI), или искусственного интеллекта для диалога. Безусловно, все это не в последнюю очередь вопрос терминологии и маркетинга программных решений, но тем не менее.
Потребность в бизнес-аналитиках здесь очевидна. Считается, что в рассматриваемом случае формируются целые команды из экспертов разных направлений бизнеса, из различных коммерческих и даже государственных предприятий. Роли программистов и Data Scientists, естественно, сохраняются. Примечательно также, что в отличие от более простых сценариев, в случае внедрения диалогово-ориентированных речевых систем появляется потребность в ИТ-архитекторах.
От NLP до Dialog Management — эволюция решаемых задач, продуктов, функций и специалистов
API-экономика
Важно понимать, какие тренды формируют практическую потребность в чатботах с «широким кругозором». Прежде всего, это вызвано движением к так называемой API-экономике (API economy), или иными словами, такой глобальной бизнес-среде, при которой большинство бизнес-компаний, некоммерческих структур и государственных организаций имеют возможность доступа к своим ИТ-ресурсам через программный интерфейс API. Логика проста — вкладываться в организацию полноценного диалога с помощью речевых технологий бессмысленно, если мы имеем доступ лишь к корпоративной системе и, соответственно, можем предложить клиенту лишь товары из собственного каталога и больше ничего. При самом высоком интеллекте чатбота полноценного диалога здесь, очевидно, не может получиться.
Другое дело, если мы можем в реальном времени «подтягивать» необходимые в конкретный момент диалога данные из очень широкого набора внешних источников, включая зарубежные. Если, предположим, чатботы, через API, могут получать данные с GPS-приемника собеседника, с персональных носимых или медицинских устройств, знать о его последних покупках и т. д., то всё коренным образом меняется.
В большей степени в использовании чатботов с «широким кругозором» продвинулись муниципальные власти крупных городов, претендующих на то, чтобы относиться к категории «умных» (smart cities). В них, как правило, хотя бы частично реализована пресловутая концепция открытых данных (open data). Она, в свою очередь, материализует идеи API-экономики, представляя посредством стандартных программных интерфейсов доступ к множеству городских информационных ресурсов. И формирование диалог-ориентированных чатботов в данном случае, по сути, лучший способ раскрыть потенциал этих данных и показать, что город реально является умным. В некоторых городах Европы и Америки (Копенгаген, Чикаго, Филадельфия, Стокгольм) подобные сервисы уже реализуются. С их помощью можно не столько задать вопрос, а скорее поговорить с чатботом, скажем, на темы городской безопасности, экологической обстановки, проблемах эксплуатации и развития городской системы общественного транспорта и т. д.
В бизнесе продвинутые чатботы, несмотря на явную перспективу, пока отвоевывают свое место с трудом. Отчасти это связано с нежеланием независимых бизнесов взаимно делиться своими ИТ-ресурсами.
Роботизация бизнес-процессов
Вторая тенденция, влияющая на развитие диалоговых функций чатботов, — это рост направления роботизации бизнес-процессов (Robotic process automation, RPA) 1. Речь здесь, в основном, идет об организации интерфейса между «зашитыми» внутри процессов программными роботами и сотрудниками, вовлеченными в процесс. Такие чатботы можно трактовать и как инструмент взаимодействия «человек-процесс» (а не «человек-машина»), и как средство коллективного взаимодействия сотрудников, но не напрямую, а через тот же самый роботизированный процесс. На процессы, как известно, в реальном времени оказывают влияние всевозможные исключения и действия иных сотрудников. Изменение процессов может повлиять на работу смежных служб предприятия, и таким образом речевой интерфейс с развитыми диалоговыми возможностями оказывается весьма востребованным.
Однако технология RPA, несмотря на очень мощную раскрутку, проникает в бизнес, мягко говоря, не без проблем. Примеры ее бизнес-применения найти можно, но они немногочисленны.
Перспективы использования чатботов второго поколения
Чатботы первого поколения функционально были больше ориентированы на продажи, и уже не раз упомянутый пример с реализацией авиабилетов яркое тому подтверждение. В этой сфере даже без чатботов взаимодействие продавец-покупатель традиционно строилось довольно прямолинейно, без детального учета его истории и каких-либо особых смысловых нюансов. Другое дело сфера маркетинга. По мере зрелости технологических разработок и большей готовности диалог-ориентированных чатботов к практическому применению, ими начинают все больше интересоваться. маркетологи из самых разных отраслей. А для них диалог с потребителем играет ключевое значение. Они могут, скажем, интересоваться корреляцией продаж различных товаров, тем, почему покупатель покидает магазин не в лучшем настроении, и задавать массу подобных вопросов, которые в сфере продажах зачастую не возникают.
Соответственно, потребность в полноценных роботизированных диалогах, в интеграции данных, которые, по сути, эти диалоги питают, становится более явной. Попутно возникают новые направления, подобные, скажем, оценке эмоционального состояния собеседника (Sentiment Analysis), которые, кстати, в отличие от многих других компонентов обработки речи, развиваются самостоятельно в ситуациях обработки текста и голоса. И таким образом речевые интерфейсы должны будут становиться богаче и разнообразнее.
* * *
В заключение отмечу, что если интерес пользователя к речевым технологиям сосредотачивается на Enterprise-сегменте, а не сценариях домашнего применения, следует ориентироваться не на то, как внедряются пресловутые цифровые помощники (наподобие Apple Siri, Amazon Alexa или Яндекс.Алиса). Следует пристально наблюдать за развертыванием речевых технологий в контакт-центрах и на электронных торговых площадках. Там есть место фактически любым имеющимся на сегодня продуктам речевого взаимодействия. Бизнес-процессы в компаниях такого профиля часто отработаны до автоматизма и неплохо поддаются количественному измерению различными KPI. Отработаны они настолько детально, что работники контакт-центров, занимающихся исходящими звонками, едва ли не сами больше начинают напоминать роботов. Здесь, если какая-либо система и начинает внедряться, можно быть уверенным, что в самой ближайшей перспективе речь пойдет об ее промышленном использовании и что экономический эффект уже детально оценен.
Чтобы оставить комментарий пожалуйста Авторизуйтесь