Рулетка или прогноз: как работает футбольный суперкомпьютер Opta

На днях мы публиковали очередную версию прогноза на исход чемпионата мира по футболу, сделанную "суперкомпьютером Opta". Это название часто мелькает в новостях, к нему уже привыкли и, как правило, не задумываются, что за этим стоит и как оно работает. Сегодня Terrikon.com касается этой деликатной проблемы...
Напомним, суперкомпьютер спрогнозировал, что с наибольшей вероятностью (16.1%) чемпионом мира станет Испания. Другие фавориты - Франция (13%), Англия (11.2%), Аргентина (10.4%). У остальных - менее 10%. Ничего неожиданного в этом нет, и так должно быть. Ведь суперкомпьютер берет данные не с потолка, а из футбольной реальности, а значит, прогнозирует будущее, которое должно казаться правдоподобным.
Алгоритм Opta (Opta Supercomputer) — это статистическая модель на основе многочисленных симуляций того или иного турнира. Это не "искусственный интеллект" в современном смысле, а мощная вероятностная модель. Осуществляя множество (иногда десятки тысяч) симуляций, она понимает, какие тут существуют вероятности, какой у них процент реализации и кто, соответственно, в доме главный хозяин (а кто - не очень).
Для начала, каждая команда получает рейтинг силы атаки и обороны на основе Opta Power Rankings (собственный рейтинг Opta, составленный по историческим и недавним результатам). Учитываются коэффициенты букмекеров, поскольку они отражают рыночную оценку (это важно!). Вводятся данные о текущих выступлениях (форма, результаты личных встреч, домашний фактор и все такое прочее).
Учитываются самые разные нюансы. Например, в случае с чемпионатом мира - то, что защитить титул удавалось очень редко (всего дважды, Италии и Бразилии, причем в последний раз - аж в 1962). Поэтому при оценке шансов сборной Аргентины на мундиале-2026 суперкомпьютер срезал ей по этой причине какие-то проценты.
После того, как вся вышеописанная калькуляция завершена и всем командам вписали их текущие данные, начинается веселый процесс, который почему-то называется "симуляция Монте-Карло". Модель прогоняет турнир снова и снова, тысячи раз. Каждый раз исходы матчей определяются случайно, но в соответствии с рассчитанными вероятностями. Сильная команда чаще выигрывает, но всегда остается место для сенсаций. То есть это все-таки не совсем Монте-Карло или Лас-Вегас, это не чистая рулетка.
После заданного количества симуляций происходит подсчет. Программа смотрит, в скольких случаях команда достигла какого-то результата - выиграла группу, вышла в 1/8, четвертьфинал, полуфинал, финал, стала чемпионом. То есть, если в нашем случае Испания имеет 16,1% на победу в чемпионате мира, а произведено было 10 тысяч симуляций — значит, она выигрывала титул в 1610 случаях. Что, конечно, очень хороший результат при 48 участниках.
Важно понимать, что это не пророчество, а математическая оценка шансов на основе доступных данных. А значит, относиться к этим цифрам нужно спокойно. Футбол полон случайностей (травмы, судейство, везение, мотивация), поэтому даже фаворит с 16% все равно чаще проигрывает турнир, чем выигрывает. Но при общей оценке ситуации такая модель дает прекрасную картину.
Среди тысяч вариантов чемпионата мира, возникших у суперкомпьютера в ходе этого эксперимента, встречались самые удивительные. Выигрывали почти все. Даже Гаити в одном из 10 000 вариантов умудрилась прийти к финишу первой (интересно, за счет чего это ей там, в цифровой реальности, удалось?). И только Кюрасао - единственный из 48 участников - ни разу не победил.
Ну и, кстати, если уж мы назвали фаворитов предстоящего первенства по версии суперкомпьютера, то надо заглянуть и в нижнюю часть рейтинга. Там - 5 команд, у которых 0% на победу (ДР Конго, Катар, Кабо-Верде, Гаити и Кюрасао). Да, все они, кроме Корасао, смогли победить в одной-двух симуляциях - но общая вероятность титула исчислялась столь ничтожной долей процента, что при округлении все равно получился ноль.
Ну да, и еще 8 сборных получили почетную 0.1% на победу в чемпионате мира (Тунис, Южная Африка, Панама, Новая Зеландия, Ирак, Иордания, Саудовская Аравия, Узбекистан).
Очень пессимистично отнесся суперкомпьютер и к шансам хозяев. Самым перспективным из них, сборной США, он дал 1.2% на победу, мексиканцы получили ровно процент, а канадцы - 0.7%.
А в заключение посмотрим, что пишет статистическая контора Opta, аргументируя выбор своим "суперкомпьютером" главного фаворита турнира - Испании: "В огромном поле из 48 команд ни у кого не будет заоблачных процентов, но Испания выделяется: она — единственная сборная, у которой вероятность выхода в четвертьфинал выше 50% (52,1%). "Ля Роха" имеют 39,0% шансов на полуфинал и 25,6% — на выход в финал. Суперкомпьютер считает, что Испания легко может пройти первый этап: в 75,3% симуляций она выиграла группу H (с Уругваем, Саудовской Аравией и Кабо-Верде). Испания традиционно лучше выступает на Евро, чем на мировых первенствах (единственный выход в полуфинал за последние 14 участий — победа в 2010 году в ЮАР). Тем не менее суперкомпьютер уверен в ней. И кому-то придется очень постараться, чтобы опередить ее".
Ну что ж, все вроде бы логично - по крайней мере, пока не прозвучал свисток судьи.
