Событие активно
Превзойдёт ли Google Gemini все SOTA на MMLU-Pro, GPQA и MMMU-Vision до 30.06.2026?
Объем4 BPCX
Вероятность ДА
100 BPCX
100 BPCX
ОписаниеGoogle Gemini — флагманская мультимодальная модель компании, конкурирующая с OpenAI и Anthropic. Метрики MMLU-Pro, GPQA и MMMU-Vision оценивают уровень когнитивных и мультимодальных способностей моделей. Превышение всех трёх бенчмарков одновременно станет важным показателем технологического лидерства Gemini.
УсловияРазрешится «Да», если до 30 июня 2026 года Google официально объявит о версии Gemini, которая превосходит state-of-the-art результаты одновременно на тестах MMLU-Pro, GPQA и MMMU-Vision.
Разрешится «Нет» в любом другом случае.
Верификация:
Google DeepMind Blog
· Papers with Code — Leaderboards
Таймлайн
Открыто1 нояб. 2025 г., 08:20
Закрывается30 июн. 2026 г., 20:59
Завершается30 июн. 2026 г., 21:00
Открыто1 нояб. 2025 г., 08:20
Закрывается30 июн. 2026 г., 20:59
Завершается30 июн. 2026 г., 21:00
АктивностьПосмотреть всю
Топ сделавших прогнозПосмотреть всех
Проголосовали ДА
#
Пользователь
Объем
Проголосовали НЕТ
#
Пользователь
Объем
