Часть 3 Как работает модель
xG, признаки модели, walk-forward, переобучение и реальное преимущество.
Учебник Betsline — Часть 3
Продвинутый уровень: как работает модель и где реальное преимущество
Введение в ожидаемые голы (xG)
Когда большинство игроков смотрят на таблицу или историю встреч, они видят только финальный счет. Но счет в футболе — крайне необъективная метрика. Команда может нанести 20 опасных ударов, попасть в штангу 3 раза и проиграть из-за одного шального удара с 40 метров.
Здесь на помощь приходит xG (Expected Goals — Ожидаемые голы). Это показатель качества созданных моментов. Каждому удару присваивается вероятность того, что он станет голом (от 0.01 до 0.99), основываясь на исторических данных (угол удара, расстояние, часть тела, тип паса и т.д.).
### Почему xG важнее счета?
Счет показывает результат (который сильно зависит от случайности и удачи).
xG показывает процесс (качество игры команды).
Пример анализа:
| Матч | Реальный счет | xG (Ожидаемые голы) | Кто играл лучше? |
|---|---|---|---|
| Команда А - Команда Б | 0:1 | 2.50 - 0.30 | Команда А доминировала, но ей не повезло. |
| Команда В - Команда Г | 3:0 | 1.10 - 1.05 | Игра была равной, Команде В повезло с реализацией. |
Букмекеры и профессиональные аналитики больше не смотрят на счет. Они смотрят на процесс. Наша модель также базируется на метриках ожидаемых голов, интенсивности прессинга и других продвинутых показателях, которые позволяют увидеть реальную силу команды.
Признаки (Features) в нашей математической модели
Математическая модель машинного обучения не "смотрит" футбол. Она обрабатывает массивы данных. Чтобы модель могла предсказывать исходы, мы скармливаем ей признаки (features) — формализованные метрики команд перед матчем.
Основные группы признаков, которые мы используем:
- Метрики xG: Не только общий xG, но и ожидаемые пропущенные голы (xGA), разница xG (xGD) в последних матчах.
- Форма команд: Взвешенная оценка последних 5-10 матчей, где недавние игры имеют больший вес.
- Интенсивность прессинга (PPDA): Показывает, насколько агрессивно команда отбирает мяч на чужой половине поля.
- Рыночные данные: Мы обязательно учитываем коэффициенты открытия (opening odds) азиатских букмекеров, так как в них заложена экспертная оценка рынка.
- Фактор поля: Историческое преимущество домашней арены для конкретной команды.
Обучаясь на десятках тысяч матчей, модель находит скрытые закономерности (паттерны). Например, она может "заметить", что команда с высоким PPDA (интенсивным прессингом) часто побеждает команды, которые плохо выходят из обороны через короткий пас.
Обучение и проверка модели (Walk-forward analysis)
Самая большая ошибка новичков в аналитике данных — это переобучение (overfitting). Это ситуация, когда модель идеально предсказывает прошлое, но полностью проваливается в будущем.
Чтобы избежать этого, в Betsline используется метод Walk-forward валидации:
- Модель обучается на данных сезонов 2018-2021.
- Тестируется (делает ставки) на сезоне 2021/22. Мы записываем прибыль/убыток.
- Затем модель обучается на данных 2018-2022.
- Тестируется на сезоне 2022/23. И так далее.
Мы никогда не тестируем модель на тех данных, которые она уже видела. Это гарантирует, что показываемый нами ROI (возврат инвестиций) в архиве максимально приближен к реальности.
Как тренироваться в Песочнице Betsline
Понимание теории — это хорошо, но без практики теория забывается. Мы создали уникальный инструмент — Песочницу Betsline (Sandbox). Это симулятор реальных ставок на архивных данных без риска потерять деньги.
### Как работает Песочница?
- Перейдите в раздел Sandbox.
- Выберите лигу (например, Английскую Премьер-лигу) и сезон.
- Нажмите "Начать тренировку".
- Система перенесет вас в прошлое. Вы увидите матч, коэффициенты букмекеров и аналитику нашей модели, но не будете знать, кто играет и какой это год (чтобы вы не использовали свои знания из будущего).
- Ваша задача — проанализировать карточку матча (сравнить Market Odds и Model Prob, оценить Edge и сигнал).
- Принять решение: Сделать ставку или Пропустить (Skip).
- Сразу после этого вы увидите реальный результат матча и экспертный разбор (Takeaway).
### В чем польза?
В Песочнице вы за 30 минут можете прожить целый сезон (380 матчей), принимая решения. Ваш виртуальный банкролл покажет, насколько успешно вы находите Value. Это прививает системное мышление и дисциплину быстрее, чем годы реальных ставок по 2 матча в неделю.
Тренируйтесь в Песочнице до тех пор, пока ваш график банкролла не начнет уверенно расти вверх. После этого вы будете готовы к реальному рынку.