Вісім підходів до ІІ обробки на основі природної мови

У сучасному світі системи ІІ з підтримкою природної мови – це не просто приємне доповнення, це необхідність. За даними Gartner, «до 2024 року до 80% брендових цифрових вражень надаватиметься через віртуальних людей».

Віртуальний співрозмовник на основі ІІ виходить далеко за межі човнів. Системи ІІ, які опрацьовують природну мову, можу підтримувати діалог, схожий на людську, розуміють контекст і пропонують інтелектуальні відповіді за кілька мілісекунд. Простіше кажучи, обробка природної мови – це комп’ютерна програма, яка розуміє мову людини за звичайної мови. Природна обробка мови постійно змінюється — нові розробки в галузі технологій і стратегії, що постійно змінюються, дозволяють уточнити моделі обробки мови.

За даними Gartner існує вісім підходів до обробки природної мови, див. статтю: Gartner 2021. Стратегічний сценарій дій для корпоративних ІІ: архітектура природної мови, Ентоні Маллен, Магнус Реван, Стівен Еммотт, Ерік Бретену, Берн Елліот, Джессіка Е0х2 року:

№ 1 Загальні мовні моделі чи моделі трансформації

У 2020 році багато постачальників почали використовувати це нове революційне рішення для обробки мови. Ці моделі використовуються системами Insight, текстовими аналітичними системами, системами генерації природної мови (NLG) та системами штучного інтелекту для спілкування у всіх галузях технологічного процесу. Ці узагальнені мовні моделі часто використовуються при використанні заздалегідь створених моделей глибокого навчання (з трильйонами параметрів) для створення спеціалізованих моделей для окремих галузей і організацій. Прикладами таких моделей є BERT/Meena та GPT2/3.

№ 2 Міжплатформне програмне забезпечення для віртуальних співрозмовників

Міжплатформне програмне забезпечення дозволяє використовувати гнучке поєднання мовних і розмовних механізмів. Відділення базового механізму від його даних для навчання, а також розробка та інтеграція режиму діалогу. Типовими механізмами, які використовують ці постачальники міжплатформного програмного забезпечення, є Amazon Lex, Microsoft Bot Framework, Google Dialogflow, IBM Watson і Rasa. (Див. розділ Використання міжплатформного програмного забезпечення для створення ІІ віртуальних співрозмовників, чат-ботів та віртуальних помічників).

№ 3 Розширення систем пошуку та ведення діалогу для обчислювальних запитів

Большинство инструментов бизнес-аналитики предлагают какой-то вариант интерфейса для естественного языка для своей работы. Однако подход, используемый в большинства таких инструментов, нельзя назвать полностью разговорным. При этом улучшение вычислительных запросов идет гораздо быстрее. Последним перспективным инструментом является Google TAPAS, который использует обобщенные языковые модели для работы с табличным данным. Узнайте больше об эволюции бизнес-аналитики и естественного языка в отчете Конфликт миров: расширенная аналитика поглощает аналитику, бизнес-аналитику и интеллектуальную обработку данных.

№ 4 Модульні системи глибокого навчання та модулі від постачальників систем природної мови

Великі постачальники, такі як Alibaba, Oracle, IBM та Microsoft, розробляють можливості для роботи з документами, мовленням, перекладами та розмовними даними із загального стеку моделей природної мови та загальних компонентів.

№ 5 Демократизація поширення природної мови серед розробників-аматорів

Незалежно від того, йдеться про пошук чи спілкування, багато постачальників покращили режим «що бачиш, те й отримуєш» в інструментах для розробників-аматорів і зробили нетехнічні інтерфейси доступнішими. Малокодові та безкодові інструменти проектування доступні не тільки для діалогу. Віртуальний співрозмовник — це лише одна з багатьох речей, яку можуть створювати розробники-аматори без технічних знань. Сьогодні малокодові та безкодові платформи пропонують не лише проектування діалогів, але й розробку RPA та додатків пошуку, а також більш стандартні елементи дизайну Web 2.0.

№ 6 Постачальники, що пропонують мультимодальні пропозиції та розширені мовні моделі для використання машинного зору та перекладу

Мовні послуги розвиваються, стаючи все більш мультимодальними, що покращує природне спілкування між людьми та машинами. Наприклад, OpenStream надає можливість одночасного спілкування з програмами для картографування та взаємодії з ними. І Baidu Translate приймає сигнали не тільки від слів, але й від візуальних об’єктів у відеосцені.

№ 7 Еволюція доступу до даних, управління метаданими та системами на основі графіків

В даний час у сфері розподіленого управління даними та їх збагачення використовується Data Fabric. Вона дозволяє багаторазово використовувані послуги даних, конвеєри, семантичні рівні та API-інтерфейси завдяки поєднанню різних підходів до інтеграції даних. Крім того, можна покращити Data Fabric, додавши динамічне розпізнавання схем або навіть оптимізацію з урахуванням витрат (див. Демістифікація Data Fabric).

№ 8 Розробляється набір інструментів та сервісів для проектів з природною мовою

Компанії, що займаються маркуванням даних та анотаціями, все частіше використовує сервіси текстових та мовленнєвих анотацій, а також машинного зору. Перекладацькі фірми керують робочими навантаженнями, використовуючи перекладацькі центри, у яких задіяні як співробітники, і комп’ютерні моделі.