Поисковые системы на основе ИИ

Поисковые системы на основе ИИ

Еще одним преобразующим направлением в развитии ГИИ – являются поисковые системы с использованием LLM, что в значительной степени трансформирует все поисковые системы.

В чем заключается принцип работы?

LLM анализирует пользовательский запрос, учитывая контекст и намерения, что позволяет точнее интерпретировать сложные или неоднозначные формулировки.

На основе анализа запроса система определяет релевантные источники данных, используя как внутренние базы знаний, так и внешние ресурсы, обеспечивая доступ к актуальной информации.

Обычно происходит сканирование 3-7 внешних источников информации так, как если бы это делал человек, далее на основе парсинга данных или информации формируется экстракт/сжатое конспектирование в соответствии с запросом, объединяя информацию из разных источников к «усреднённому показателю».

LLM синтезирует полученную информацию, формируя связный и информативный ответ, адаптированный под стиль и тональность запроса.

По сути, это умный поиск. Цель очень простая – быстрое получение информации без необходимости самостоятельного изучения множества внешних ссылок так, как мы это делали последние 25 лет.

Я, очевидно, не буду устраивать обзоры на каждую систему, а приведу краткий опыт использования.

Умный поиск – это то, что я пытался выжать с LLM с первых дней их появления задолго до того, как это стало мейнстримом. Об этом писал в канале год назад, по факту не получилось ничего хорошего. Результат был очень посредственным.

Есть множество ограничений.

Прямой парсинг данных поисковыми ботами с большинства медиа ресурсов заблокирован. Прямых дата провайдеров нет.

Использование автоматизированного поиска с переходом на первые 10-15 ссылок в поисковых запросах через веб шлюзы не дает желаемого ресурса, т.к. каждый сайт имеет свою структуру, а автоматическую интеллектуальную навигацию по рандомным сайтам не удалось реализовать, что затрудняет качественное получение информации.

Есть множество развитых сервисов интеллектуального поиска. У всех на слуху раскрученный Perplexity, но на самом деле результаты достаточно посредственные.

Что сейчас есть на рынке?

1. ChatGPT Search (OpenAI)

2. Perplexity AI

3. Genspark AI (один из самых мощных и эффективных аналогов Perplexity)

4. DeepSeek (встроенный поиск)

5. Mistral AI (встроенный поиск)

6. Google Gemini (встроенный поиск)

7. Felo AI

8. You com AI

9. Komo AI

10. Phind AI (в основном для поиска технической информации)

11. Yandex Нейро-поиск через сервисы Яндекс (приоритетный формат для поиска в русскоязычном сегменте).

12. Hix AI

13. Bing AI с использованием Copilot.

Какие впечатления? Для поиска прямых источников данных – бесполезны, все также Google поиск. Для проведения научно-исследовательских работ – бесполезны, т.к. упускают все важные детали, только ручной поиск и последовательное изучение.

Где могут быть полезны? Краткие справки по событиям, процессам, плюс новостные дайджесты по конкретной теме или инфо поводу, но вновь упускают много важных дателей. Поиск почти всегда неполный, вот именно поэтому нужно иметь буквально десяток резервных каналов/сервисов. Полезны для подбора товаров и услуг, выступая в роли консультанта/советника.

Где бы хотел видеть прогресс, которого пока нет? Подготовка аналитических сюжетов по выбранному направлению. К этому ближе всех подошел не распиаренный Perplexity AI, а никому неизвестный Genspark.ai.

Подготовка сведенных таблиц, сводок по указанному сценарию. Например, сведенная таблица основных технических характеристик всех топовых смартфонов в категории от 700 долларов, выпущенных с 2022 по 2025 года. В этом направлении прогресс есть, но до идеала очень далеко.

По новостям сейчас работают на 4-5 баллов из 10, по сведенной информации на 2-3 балла, по аналитическим сюжетам примерно также.

ChatGPT Search сейчас лучше Perplexity, а Genspark демонстрирует интересные показатели. На удивление хорош DeepSeek, даже не ожидал, часто лучше ChatGPT и Perplexity. Google мне не нравится, хотя кому, как не им делать умный поиск.

По русскоязычному сегменту неплох Яндекс.

Источник: Telegram-канал "Spydell_finance"

Топ

Лента новостей