Event
Go back
The event is active

Превзойдёт ли Google Gemini все SOTA на MMLU-Pro, GPQA и MMMU-Vision до 30.06.2026?

Volume~$135
Science
IT
YES chance
100 BPCX
100 BPCX
DescriptionGoogle Gemini — флагманская мультимодальная модель компании, конкурирующая с OpenAI и Anthropic. Метрики MMLU-Pro, GPQA и MMMU-Vision оценивают уровень когнитивных и мультимодальных способностей моделей. Превышение всех трёх бенчмарков одновременно станет важным показателем технологического лидерства Gemini.
ConditionsРазрешится «Да», если до 30 июня 2026 года Google официально объявит о версии Gemini, которая превосходит state-of-the-art результаты одновременно на тестах MMLU-Pro, GPQA и MMMU-Vision. Разрешится «Нет» в любом другом случае. Верификация: Google DeepMind Blog · Papers with Code — Leaderboards
Timeline
OpenedNov 1, 2025, 8:20 AM
ClosesJun 30, 2026, 8:59 PM
EndsJun 30, 2026, 9:00 PM
OpenedNov 1, 2025, 8:20 AM
ClosesJun 30, 2026, 8:59 PM
EndsJun 30, 2026, 9:00 PM
ActivityView all
Top poll holdersView all
Voted for YES
#
User
Vol.
1
ton_explore
ton_explore
30 BPCX
2
5kkkkkkusdt
5kkkkkkusdt
22 BPCX
3
InsaneHammock
InsaneHammock
12 BPCX
4
111
111
5 BPCX
5
buba
buba
5 BPCX
Voted for NO
#
User
Vol.
1
joS_edge
joS_edge
18 BPCX
2
NastyAeolis
NastyAeolis
16 BPCX
3
FirmGang
FirmGang
14 BPCX
4
ConicMalraux
ConicMalraux
4 BPCX
5
MMTrader
MMTrader
3 BPCX
Choose a sideПревзойдёт ли Google Gemini все SOTA на MMLU-Pro, GPQA и MMMU-Vision до 30.06.2026?
The event is active

Превзойдёт ли Google Gemini все SOTA на MMLU-Pro, GPQA и MMMU-Vision до 30.06.2026?

Volume~$135
Science
IT
DescriptionGoogle Gemini — флагманская мультимодальная модель компании, конкурирующая с OpenAI и Anthropic. Метрики MMLU-Pro, GPQA и MMMU-Vision оценивают уровень когнитивных и мультимодальных способностей моделей. Превышение всех трёх бенчмарков одновременно станет важным показателем технологического лидерства Gemini.
ConditionsРазрешится «Да», если до 30 июня 2026 года Google официально объявит о версии Gemini, которая превосходит state-of-the-art результаты одновременно на тестах MMLU-Pro, GPQA и MMMU-Vision. Разрешится «Нет» в любом другом случае. Верификация: Google DeepMind Blog · Papers with Code — Leaderboards