Microsoft запускает Critique для глубоких исследований: как ИИ-агенты меняют аналитику данных

Искусственный интеллект 7 мин чтения

Microsoft представил Critique - систему для комплексных исследований. Она использует несколько ИИ-моделей одновременно. Первая модель формирует базовый ответ. Вторая выполняет роль критика, проверяя точность и исправляя ошибки перед выдачей финального результата.

Как работает многомодельная система исследований

Critique показывает высокие результаты по бенчмарку DRACO. Сравнительных данных с другими системами пока недостаточно. Режим Council обрабатывает запросы через несколько моделей параллельно. Он демонстрирует все варианты ответов, плюс анализ совпадений и расхождений между моделями.

Похожий подход реализован в Azure AI Foundry Agent Service через модель o3-deep-research от OpenAI. Система интегрирована с поиском Bing и выполняет многоэтапный процесс:

Планирование поисковых запросов
Анализ найденной информации
Синтез данных с указанием источников
Генерация отчетов с прослеживаемыми выводами

Практические возможности для бизнеса

Модель o3-deep-research обрабатывает до 200 тысяч токенов входящего контекста. Она генерирует до 100 тысяч токенов результата. Стоимость составляет $10 за миллион входящих токенов и $40 за миллион исходящих. Доплата за веб-поиск - $1.

Azure AI Foundry предлагает разработчикам полный набор инструментов:

File Search для анализа документов из SharePoint и OneDrive
Web Search через Bing для актуальной информации
Function Calling для взаимодействия с внешними API
Code Interpreter для выполнения Python-кода
Browser Automation для задач в браузере

Бенчмарки и оценка эффективности

Исследователи создали бенчмарк LiveDRBench со 100 сложными задачами по научным темам и общественным событиям. Метрики precision, recall и F1 показывают результаты от 0.02 до 0.72. Лучший показатель 0.55 демонстрирует OpenAI.

Анализ выявил слабые места в механизмах поиска и привязки к источникам. Это указывает на необходимость улучшения алгоритмов для более точного извлечения релевантной информации.

Применение в фармацевтике и науке

Компания Eli Lilly инвестировала до $2 млрд в партнерство с Insilico Medicine. Цель - разработка лекарств с помощью ИИ. Это подтверждает тренд использования искусственного интеллекта. Он ускоряет исследовательские процессы и снижает затраты.

Microsoft Research достигла высоких результатов в медицинской диагностике. Она улучшила выживаемость пациентов с раком пищевода более чем на 90% за пять лет. Компания также разработала GraphRAG для работы с приватными данными. Создала Orca-Math - модель, достигшую производительности крупных систем на 200 тысячах математических задач.

Доступность и ограничения

Critique пока недоступен широкой аудитории. Можно подать заявку на ранний доступ. Неясно, войдет ли инструмент в подписку за $20. Альтернативный вариант - самостоятельная сборка многомодельного пайплайна через API. Это может оказаться дешевле.

Azure AI Foundry Agent Service находится в публичном превью для классической версии. Система поддерживает корпоративную безопасность через RBAC и OAuth. Масштабируемость и композиция с Logic Apps и Azure Functions доступны.

Для селлеров на маркетплейсах подобные технологии открывают возможности автоматизации аналитики отзывов маркетплейсов. Они формируют детальные отчеты о конкурентах. Сервисы вроде SaleSynergy уже применяют ИИ-агентов для обработки обратной связи клиентов. Это позволяет командам сосредоточиться на стратегических задачах роста продаж.

Что делать селлерам

Изучите возможности ИИ-инструментов для анализа данных о товарах и конкурентах. Рассмотрите интеграцию автоматизированных систем. Они обрабатывают большие объемы информации. Оцените экономическую эффективность готовых решений против самостоятельной разработки через API.

Многомодельные системы исследований становятся стандартом для глубокой аналитики. Компании, которые внедрят эти технологии раньше, получат конкурентное преимущество в скорости и качестве принятия решений.