Событие активно
Превзойдёт ли Google Gemini все SOTA на MMLU-Pro, GPQA и MMMU-Vision до 30.06.2026?
Объем~$135
Вероятность ДА
100 BPCX
100 BPCX
ОписаниеGoogle Gemini — флагманская мультимодальная модель компании, конкурирующая с OpenAI и Anthropic. Метрики MMLU-Pro, GPQA и MMMU-Vision оценивают уровень когнитивных и мультимодальных способностей моделей. Превышение всех трёх бенчмарков одновременно станет важным показателем технологического лидерства Gemini.
УсловияРазрешится «Да», если до 30 июня 2026 года Google официально объявит о версии Gemini, которая превосходит state-of-the-art результаты одновременно на тестах MMLU-Pro, GPQA и MMMU-Vision.
Разрешится «Нет» в любом другом случае.
Верификация:
Google DeepMind Blog
· Papers with Code — Leaderboards
Таймлайн
Открыто1 нояб. 2025 г., 08:20
Закрывается30 июн. 2026 г., 20:59
Завершается30 июн. 2026 г., 21:00
Открыто1 нояб. 2025 г., 08:20
Закрывается30 июн. 2026 г., 20:59
Завершается30 июн. 2026 г., 21:00
АктивностьПосмотреть всю
Топ сделавших прогнозПосмотреть всех
Проголосовали ДА


#
Пользователь
Объем
1

ton_explore
ton_explore30 BPCX
2

5kkkkkkusdt
5kkkkkkusdt22 BPCX
3
InsaneHammock
InsaneHammock12 BPCX
4
111
1115 BPCX
5

buba
buba5 BPCX
Проголосовали НЕТ
#
Пользователь
Объем
1
joS_edge
joS_edge18 BPCX
2
NastyAeolis
NastyAeolis16 BPCX
3
FirmGang
FirmGang14 BPCX
4
ConicMalraux
ConicMalraux4 BPCX
5
MMTrader
MMTrader3 BPCX
Событие активно
Превзойдёт ли Google Gemini все SOTA на MMLU-Pro, GPQA и MMMU-Vision до 30.06.2026?
Объем~$135
ОписаниеGoogle Gemini — флагманская мультимодальная модель компании, конкурирующая с OpenAI и Anthropic. Метрики MMLU-Pro, GPQA и MMMU-Vision оценивают уровень когнитивных и мультимодальных способностей моделей. Превышение всех трёх бенчмарков одновременно станет важным показателем технологического лидерства Gemini.
УсловияРазрешится «Да», если до 30 июня 2026 года Google официально объявит о версии Gemini, которая превосходит state-of-the-art результаты одновременно на тестах MMLU-Pro, GPQA и MMMU-Vision.
Разрешится «Нет» в любом другом случае.
Верификация:
Google DeepMind Blog
· Papers with Code — Leaderboards