Направления бизнес применения LLMs
Сразу к ключевому моменту – нет никаких ожиданий ускорения технологического прогресса с использованием LLMs, главным образом по причине, что на уровне архитектуры LLMs вшит «антипрогресс», т.е. фундаментальная невозможность генерации новых смыслов, идей и концепций.
Способствовать ускорению прогресса, как инструмент, в условиях работы с грамотной командой инженеров? Да, но этих инструментов много и произвести декомпозицию вклада каждого из инструмента – весьма сложно.
Несмотря на кажущиеся всемогучесть и безграничное количество сфер применения, эффективные контуры у LLMs достаточно локализованы.
Попробую дать емкое определение… В своей основе, LLM – это механизм компрессии (сжатия), причем всегда с потерями и декомпрессии (генерации), причем всегда с галлюцинациями, неструктурированных массивов данных, выстраивая градиент векторов в соответствии со статистикой распределения паттернов.
Так значит, где применение наиболее эффективно?
Когда необходимо оценить вектор смысловых конструкций, не сильно вдаваясь в детали.
- краткое резюме встреч, конференций, семинаров, лекций, выступлений, судебных заседаний;
- краткий пересказ книг, рассказов, статей, инструкций, законов, патентов, документации и т.д;
- обобщение больших массивов данных, например, поиск нарративов в новостях, аналитических и научных статьях, корпоративных отчетах и любой другой неструктурированной, но близкой по смыслу структуре данных;
- обобщение заявок в книге жалоб, обращений и в отзывах клиентов, где можно сразу определить фокусировку жалоб, сильные и слабые стороны продукта или услуги.
Сравнительный анализ текста, например, сравнение текста регламента/закона с текстом внутренней инструкции компании на предмет противоречий. Чем эта версия договора отличается от предыдущей? Подсвети риски, которые появились и похожие сценарии.
Стилистическая трансформация (или «перепиши текст в другом стиле»). Упрощение юридических формулировок, условий страхования или банковских договоров для обычных клиентов (простыми словами) или наоборот, превращение тезис в юридический документ, жалобу в официальные органы или техническое задание. Здесь же адаптация контента под разную аудиторию (возраст, профессия, когнитивная глубина).
Реструктуризация текста (Entity Extraction). Выделение из стенограммы совещания конкретных договоренностей: кто, что должен сделать, к какому сроку или выделение из скан копий договоров детализацию реквизитов для формирования другой докумнтации.
Креативная генерация – как принудительное создание пространства решения, например, генерация вариантов заголовков для статьи или слогана для рекламной кампании.
Мозговой штурм – из этой же серии, но более иерархическая и структурная генерация смыслов по схожим паттернам и направлениям, чтобы выйти из когнитивного тупика, зашоренности, посмотреть на проблему, задачу шире.
Автоматическая разметка данных и тэгетирование: установка классификаторов и тэгов по смежным группам, например кошек, собак, хомяков объединить в группу «животные», а кирпич, песок и бетон в группу «стройматериалы».
Кластеризация и сортировка документации по сценариям: автоматическая группировка документации различного типа по сценариям. Например, договора с азиатскими клиентами на 1кв26 с суммой выше 10 млн выделить в тот кластер и т.д.
Автоматическая разметка тональности контента и намерений (Sentiment & Intent Analysis): по инструкциям можно делать маркировку степени депрессивности или оптимистичности контента на основе формулировок и частоты упоминания определенных семантических конструкций. Эмоция – это очень формализованный паттерн, где можно поймать
Извлечение сущностей и атрибутов: компании, лица, суммы, даты, юрисдикции, продукты и т.д. в зависимости от структуры данных и типа задачи.
Классификация и тегирование: автоматическая разметка обращений/новостей/документов по темам, продуктам, регионам, типам риска.
Нормализация формулировок: приведение разнородных описаний к единому словарю (например, причины жалоб, типы инцидентов, причины отказов).
Продолжение следует…






































