Направления бизнес применения LLMs

Направления бизнес применения LLMs

Сразу к ключевому моменту – нет никаких ожиданий ускорения технологического прогресса с использованием LLMs, главным образом по причине, что на уровне архитектуры LLMs вшит «антипрогресс», т.е. фундаментальная невозможность генерации новых смыслов, идей и концепций.

Способствовать ускорению прогресса, как инструмент, в условиях работы с грамотной командой инженеров? Да, но этих инструментов много и произвести декомпозицию вклада каждого из инструмента – весьма сложно.

Несмотря на кажущиеся всемогучесть и безграничное количество сфер применения, эффективные контуры у LLMs достаточно локализованы.

Попробую дать емкое определение… В своей основе, LLM – это механизм компрессии (сжатия), причем всегда с потерями и декомпрессии (генерации), причем всегда с галлюцинациями, неструктурированных массивов данных, выстраивая градиент векторов в соответствии со статистикой распределения паттернов.

Так значит, где применение наиболее эффективно?

Когда необходимо оценить вектор смысловых конструкций, не сильно вдаваясь в детали.

- краткое резюме встреч, конференций, семинаров, лекций, выступлений, судебных заседаний;

- краткий пересказ книг, рассказов, статей, инструкций, законов, патентов, документации и т.д;

- обобщение больших массивов данных, например, поиск нарративов в новостях, аналитических и научных статьях, корпоративных отчетах и любой другой неструктурированной, но близкой по смыслу структуре данных;

- обобщение заявок в книге жалоб, обращений и в отзывах клиентов, где можно сразу определить фокусировку жалоб, сильные и слабые стороны продукта или услуги.

Сравнительный анализ текста, например, сравнение текста регламента/закона с текстом внутренней инструкции компании на предмет противоречий. Чем эта версия договора отличается от предыдущей? Подсвети риски, которые появились и похожие сценарии.

Стилистическая трансформация (или «перепиши текст в другом стиле»). Упрощение юридических формулировок, условий страхования или банковских договоров для обычных клиентов (простыми словами) или наоборот, превращение тезис в юридический документ, жалобу в официальные органы или техническое задание. Здесь же адаптация контента под разную аудиторию (возраст, профессия, когнитивная глубина).

Реструктуризация текста (Entity Extraction). Выделение из стенограммы совещания конкретных договоренностей: кто, что должен сделать, к какому сроку или выделение из скан копий договоров детализацию реквизитов для формирования другой докумнтации.

Креативная генерация – как принудительное создание пространства решения, например, генерация вариантов заголовков для статьи или слогана для рекламной кампании.

Мозговой штурм – из этой же серии, но более иерархическая и структурная генерация смыслов по схожим паттернам и направлениям, чтобы выйти из когнитивного тупика, зашоренности, посмотреть на проблему, задачу шире.

Автоматическая разметка данных и тэгетирование: установка классификаторов и тэгов по смежным группам, например кошек, собак, хомяков объединить в группу «животные», а кирпич, песок и бетон в группу «стройматериалы».

Кластеризация и сортировка документации по сценариям: автоматическая группировка документации различного типа по сценариям. Например, договора с азиатскими клиентами на 1кв26 с суммой выше 10 млн выделить в тот кластер и т.д.

Автоматическая разметка тональности контента и намерений (Sentiment & Intent Analysis): по инструкциям можно делать маркировку степени депрессивности или оптимистичности контента на основе формулировок и частоты упоминания определенных семантических конструкций. Эмоция – это очень формализованный паттерн, где можно поймать

Извлечение сущностей и атрибутов: компании, лица, суммы, даты, юрисдикции, продукты и т.д. в зависимости от структуры данных и типа задачи.

Классификация и тегирование: автоматическая разметка обращений/новостей/документов по темам, продуктам, регионам, типам риска.

Нормализация формулировок: приведение разнородных описаний к единому словарю (например, причины жалоб, типы инцидентов, причины отказов).

Продолжение следует…

Источник: Telegram-канал "Spydell_finance"

Топ

Лента новостей