Совсем скоро в России начнется чемпионат мира по футболу 2018 года. Многие будут следить за этим событием, включая букмекеров, которые уже постарались предсказать итоги чемпионата. Вместе с ними эти итоги попытались предсказать и ученые. В этом им помог искусственный интеллект и совмещение известных подходов по прогнозированию исхода спортивных событий. Была написана объемная
Работу проделали Андреас Гролл из Университета Дортмунда, Кристоф Лей и Ханс Ван Эсетвед из Университета Гента, а также Гюнтер Шаубергер из Мюнхенского Технического Университета. Они проанализировали подходы, которые используют букмекеры для определения коэффициентов.
Как букмекеры работают с прогнозами
Для этого одни букмекеры моделируют матчи всех команд. На основе этих данных можно сказать, что Бразилия победит в финале чемпионата мира по футболу 2018 года с вероятностью 16,6 процента, Германия – 15,8 процента, а Испания – 12,5 процента.
Другие букмекеры используют статистическую модель, основанную на четырех факторах: рейтинг Elo, результаты квалификационных матчей, успехи в предыдущих чемпионатах мира и домашнее преимущество. На основе этих данных букмекеры отдают 24 процента на победу Германии, 19,8 процента Бразилии и 16,1 процента Испании.
Другой метод прогнозирования, который неплохо себя зарекомендовал, использует модель регрессии Пуассона. Таким образом моделируется количество голов, которые может забить команда в каждом матче чемпионата.
Как делают прогнозы ученые
Ученые должны были объединить преимущества всех методов прогнозирования и создать свой, улучшенный способ. Начали они со сбора данных о предыдущих чемпионатах мира по футболу, которые проходили с 2002 по 2014 год. При сборе информации внимание уделялось следующим факторам:
- Экономические факторы (популяция и ВВП на душу населения);
- Спортивные факторы (вероятность победы от букмекера, рейтинг FIFA);
- Домашний фактор (находилась ли команда в своей стране, на своем континенте или в своей конфедерации);
- Командные факторы (средний возраст игроков, количество товарищей по клубу, количество игроков Лиги чемпионов, количество легионеров);
- Тренерские факторы (возраст, национальность и продолжительность карьеры).
В общей сложности получилось 16 переменных. Теперь команде ученых было необходимо использовать различные методы для прогнозирования.
- Random forests – алгоритм машинного обучения;
- Регрессия – метод, в котором десятки команд рассматривались как независимые переменные;
- Ранжирование с помощью модели Пуассона для определения текущих способностей команд.
Все три метода были скомбинированы для формирования финального предсказания.
Прогноз на чемпионат мира по футболу 2018 года
В формировании этого предсказания учитывались данные с 7000 матчей 228 сборных команд. Комбинирование методов прогнозирования позволило предсказать результат каждого матча чемпионата и получить вероятность победы для каждой команды. Забегая вперед, скажем, что с вероятностью 17,8 процента кубок получит сборная Испании. Вероятность высока, но снижается соответственно для сборных Германии, Бразилии, Франции и Бельгии. Ниже приведена таблица вероятностей для каждой из команд.
Как вы можете видеть, вероятность того, что сборная России станет чемпионом мира по футболу в этом году, составляет 0,1 процента. С вероятность в 50,4 процента наша национальная сборная выйдет из группы, но четвертьфинальную игру пройти, скорее всего, не удастся.
Интересно выделить то, что шансы Испании и Германии на победу в турнире практически равны, но у Испании больше шансов дойти до финала. Согласно прогнозу, Испания выйдет из группы на матч с Уругваем, Россией, Саудовской Аравией или Египтом, в то время как Германии встретится более сильный соперник (Бразилия, Швейцария, Сербия или Коста-Рика).
Был сделан прогноз и для группового этапа. Его вы можете видеть ниже.
А вот и самый вероятный сценарий развития событий на чемпионате мира по футболу 2018 года.
Для получения этих данных использовались все преимущества различных подходов к прогнозированию и было проведено 100 тысяч симуляций турнира. Но мы все равно будем болеть за любимые сборные.