Рулетка чи прогноз: як працює футбольний суперкомп'ютер Opta

Днями ми опублікували чергову версію прогнозу щодо результатів чемпіонату світу з футболу, складеного «суперкомп’ютером Opta». Ця назва часто з’являється в новинах, до неї вже звикли і, як правило, не замислюються, що за цим стоїть і як це працює. Сьогодні Terrikon.com торкається цієї делікатної проблеми...
Нагадаємо, суперкомп'ютер спрогнозував, що з найбільшою ймовірністю (16,1%) чемпіоном світу стане Іспанія. Інші фаворити — Франція (13%), Англія (11,2%), Аргентина (10,4%). У решти — менше 10%. Нічого несподіваного в цьому немає, і так має бути. Адже суперкомп'ютер бере дані не з повітря, а з футбольної реальності, а отже, прогнозує майбутнє, яке має здаватися правдоподібним.
Алгоритм Opta (Opta Supercomputer) — це статистична модель на основі численних симуляцій того чи іншого турніру. Це не "штучний інтелект" у сучасному розумінні, а потужна ймовірнісна модель. Здійснюючи безліч (іноді десятки тисяч) симуляцій, вона розуміє, які тут існують ймовірності, який у них відсоток реалізації і хто, відповідно, у домі головний господар (а хто — не дуже).
Для початку кожна команда отримує рейтинг сили атаки та оборони на основі Opta Power Rankings (власний рейтинг Opta, складений на основі історичних та останніх результатів). Враховуються коефіцієнти букмекерів, оскільки вони відображають ринкову оцінку (це важливо!). Вводяться дані про поточні виступи (форма, результати особистих зустрічей, домашній фактор та все таке інше).
Враховуються найрізноманітніші нюанси. Наприклад, у випадку з чемпіонатом світу — те, що захистити титул вдавалося дуже рідко (всього двічі, Італії та Бразилії, причому востаннє — аж у 1962 році). Тому при оцінці шансів збірної Аргентини на мундіалі-2026 суперкомп'ютер зняв з неї з цієї причини певні відсотки.
Після того, як усі вищеописані розрахунки завершені і всім командам вписали їхні поточні дані, починається веселий процес, який чомусь називається "симуляція Монте-Карло". Модель прогоняє турнір знову і знову, тисячі разів. Кожного разу результати матчів визначаються випадково, але відповідно до розрахованих ймовірностей. Сильна команда частіше виграє, але завжди залишається місце для сенсацій. Тобто це все-таки не зовсім Монте-Карло чи Лас-Вегас, це не чиста рулетка.
Після заданої кількості симуляцій відбувається підрахунок. Програма дивиться, у скількох випадках команда досягла якогось результату — виграла групу, вийшла в 1/8, чвертьфінал, півфінал, фінал, стала чемпіоном. Тобто, якщо в нашому випадку Іспанія має 16,1% на перемогу в чемпіонаті світу, а було проведено 10 тисяч симуляцій — значить, вона вигравала титул у 1610 випадках. Що, звичайно, дуже хороший результат при 48 учасниках.
Важливо розуміти, що це не пророцтво, а математична оцінка шансів на основі доступних даних. А отже, до цих цифр слід ставитися спокійно. Футбол сповнений випадковостей (травми, суддівство, удача, мотивація), тому навіть фаворит із 16% все одно частіше програє турнір, ніж виграє. Але при загальній оцінці ситуації така модель дає чудову картину.
Серед тисяч варіантів чемпіонату світу, що виникли у суперкомп'ютера в ході цього експерименту, траплялися найдивовижніші. Вигравали майже всі. Навіть Гаїті в одному з 10 000 варіантів примудрилася прийти до фінішу першою (цікаво, за рахунок чого це їй там, у цифровій реальності, вдалося?). І тільки Кюрасао — єдиний із 48 учасників — жодного разу не переміг.
Ну і, до речі, якщо вже ми назвали фаворитів майбутнього чемпіонату за версією суперкомп'ютера, то треба зазирнути й у нижню частину рейтингу. Там — 5 команд, у яких 0% на перемогу (ДР Конго, Катар, Кабо-Верде, Гаїті та Кюрасао). Так, усі вони, крім Кюрасао, змогли перемогти в одній-двох симуляціях — але загальна ймовірність титулу все одно становила настільки незначну частку відсотка, що при округленні все одно вийшов нуль.
Ну так, і ще 8 збірних отримали почесні 0,1% на перемогу в чемпіонаті світу (Туніс, Південна Африка, Панама, Нова Зеландія, Ірак, Йорданія, Саудівська Аравія, Узбекистан).
Суперкомп'ютер дуже песимістично оцінив і шанси господарів. Найперспективнішій з них, збірній США, він дав 1,2% на перемогу, мексиканці отримали рівно 1%, а канадці — 0,7%.
А наостанок подивимося, що пише статистична контора Opta, аргументуючи вибір своїм "суперкомп'ютером" головного фаворита турніру — Іспанії: "У величезному полі з 48 команд ні в кого не буде захмарних відсотків, але Іспанія виділяється: вона — єдина збірна, у якої ймовірність виходу до чвертьфіналу вища за 50% (52,1%). "Ля Роха" має 39,0% шансів на півфінал і 25,6% — на вихід до фіналу. Суперкомп'ютер вважає, що Іспанія легко може пройти перший етап: у 75,3% симуляцій вона виграла групу H (з Уругваєм, Саудівською Аравією та Кабо-Верде). Іспанія традиційно краще виступає на Євро, ніж на світових першостях (єдиний вихід у півфінал за останні 14 участей — перемога у 2010 році в ПАР). Проте суперкомп'ютер упевнений у ній. І комусь доведеться дуже постаратися, щоб випередити її".
Ну що ж, все начебто логічно — принаймні, доки не пролунав свисток судді.
