Пойсоново разпределение – прогнозиране на голове с математика
Накратко
Пойсоновото разпределение е математически модел, с който изчисляваш точната вероятност дадено събитие да се случи определен брой пъти – например колко гола ще бележи отбор в мач. Ако знаеш средния брой голове на отбор (λ), формулата дава точните вероятности за 0, 1, 2, 3 или повече гола. Това е в основата на повечето сериозни футболни betting модели.
Какво е Пойсоново разпределение
Симеон-Дени Поасон (Siméon-Denis Poisson) е френски математик, живял в началото на 19-ти век. Неговото разпределение описва вероятността за определен брой независими събития в даден интервал от време или пространство – при условие, че средната честота на тези събития е известна.
Идеалното е при събития, които:
- са редки спрямо потенциалния брой опити
- са независими едно от друго
- имат постоянна средна скорост (λ, ламбда)
Голбелязването в повечето футболни мачове отговаря на тези критерии достатъчно добре, за да направи модела приложим. Головете са относително редки (3-4 на мач средно за двата отбора), всеки гол е до голяма степен независим от предишния, и средните показатели на отборите са относително стабилни за даден период.
Именно затова Пойсоновото разпределение стои в основата на количествения анализ на очаквани голове и е инструмент за намиране на стойностни залози на пазари като „точен резултат“ и „брой голове“.
Формулата P(k) = λ^k × e^(-λ) / k!
P(k) = вероятността за точно k гола
λ (ламбда) = очакван среден брой голове
e = числото на Ойлер ≈ 2.71828
k! = k факториел (k × (k-1) × … × 1)
k = конкретният брой голове, за който изчисляваш
Изглежда сложно, но е просто след като го видиш на практика. Нека разгледаме реален пример стъпка по стъпка.
Пример: Реал Мадрид
Вземаме Реал Мадрид в Ла Лига. За последния сезон отборът е бележил средно 2.1 гола на мач като домакин. Това е нашето λ = 2.1.
Искаме да изчислим колко вероятно е Реал Мадрид да вкара точно 2 гола в следващия домакински мач. Заместваме в формулата с k = 2:
- λ^k = 2.1² = 4.41
- e^(-λ) = e^(-2.1) = 0.1225
- k! = 2! = 2 × 1 = 2
- P(2) = (4.41 × 0.1225) / 2 = 0.5402 / 2 = 0.2700
Резултатът: 27% вероятност Реал Мадрид да вкара точно 2 гола. Ако букмейкърът предлага коеф 4.00 за „точно 2 гола Реал Мадрид”, честната цена би трябвало да е около 3.70 – тоест предложението е с отрицателна стойност и го пропускаш.
Изчисляваме по същия начин за всеки брой голове от 0 до 5+:
| Голове (k) | Изчисление | Вероятност |
|---|---|---|
| 0 гола | (1 × 0.1225) / 1 | 12.25% |
| 1 гол | (2.1 × 0.1225) / 1 | 25.72% |
| 2 гола | (4.41 × 0.1225) / 2 | 27.00% |
| 3 гола | (9.261 × 0.1225) / 6 | 18.90% |
| 4 гола | (19.45 × 0.1225) / 24 | 9.92% |
| 5+ гола | 1 – сума(0-4) | 6.21% |
Забележи: сборът на всички вероятности е точно 100%. Моделът е самопроверяващ се – ако сумата не е 100%, имаш грешка в изчислението.
Важно уточнение: λ = 2.1 е средна стойност за домакински мачове. За гостуващи мачове Реал Мадрид показва различна статистика – обикновено около 1.7-1.8 гола. Никога не ползвай общата средна стойност на отбора за двата вида мачове заедно, защото домакинското предимство изкривява модела.
Таблица с вероятности при различни λ
Ето как изглеждат вероятностите при различни средни стойности λ:
| k (гола) | λ = 0.8 | λ = 1.2 | λ = 1.5 | λ = 2.0 | λ = 2.3 | λ = 3.0 |
|---|---|---|---|---|---|---|
| 0 | 44.9% | 30.1% | 22.3% | 13.5% | 10.0% | 5.0% |
| 1 | 35.9% | 36.1% | 33.5% | 27.1% | 23.1% | 14.9% |
| 2 | 14.4% | 21.7% | 25.1% | 27.1% | 26.5% | 22.4% |
| 3 | 3.8% | 8.7% | 12.6% | 18.0% | 20.3% | 22.4% |
| 4 | 0.8% | 2.6% | 4.7% | 9.0% | 11.7% | 16.8% |
| 5+ | 0.2% | 0.8% | 1.8% | 5.3% | 8.4% | 18.5% |
Два отбора – пълен мач модел
Силата на модела се проявява при изчисляване на пълен мач. Ако изчислиш вероятностите за головете на двата отбора независимо, можеш да получиш матрица с вероятностите за всеки точен резултат.
За да получиш λ за конкретен мач, вземаш средния атакуващ показател на домакина, умножен по средния отбранителен показател на госта, умножен по средния за лигата. Тази нормализация прави модела по-прецизен. Вижте как подразбиращата се вероятност от коефициентите се сравнява с вероятностите от Пойсоновия модел – разликата е потенциален стойностен залог.
Ограничения на модела
Моделът не е перфектен. Важно е да познаваш слабите му страни:
Приема независимост на голове – в действителност след 1:0 отборите може да играят по-отворено или по-затворено, което нарушава независимостта. Мачове „до края“ са по-трудни за моделиране.
Не отчита контекст – умора, наказания, форма в момента, дали мачът е финал или редовен кръг, ниво на мотивация. Тези фактори не са в числата.
Статични λ стойности – използваш средно от сезона, но форма варира. Отбор с λ = 2.0 може да е вкарал 5 гола миналите 3 мача или 0 гола.
Проблем с малки извадки – 5 мача не са достатъчни за надеждна λ. Трябват поне 15-20 мача. За статистически значими резултати е нужна достатъчно голяма извадка.
Въпреки ограниченията, Пойсоновият модел е отличен първи филтър при идентификация на потенциални стойностни залози на пазарите за голове и точни резултати.
Практическо приложение
Ето прост работен процес за прилагане на модела:
Стъпка 1: Събери данни. За всеки отбор изчисли средния брой бележени и допускани голове за последните 15-20 мача (home/away поотделно).
Стъпка 2: Нормализирай спрямо лигата. Раздели показателя на отбора на средния за лигата, за да получиш Attack Strength и Defense Strength.
Стъпка 3: Изчисли λ за всеки отбор. λ_домакин = Attack_домакин × Defense_гост × Средна за лигата (домакини).
Стъпка 4: Приложи Пойсоновата формула за k = 0, 1, 2, 3, 4, 5+.
Стъпка 5: Изгради матрица с точни резултати и сравни с коефициентите на букмейкъра.
Ако намериш резултат, при който моделът дава 10% вероятност, но букмейкърът дава коефициент 12.00 (= 8.33% вероятност), имаш потенциален стойностен залог. Свържи с концепцията за очаквана стойност – ако EV (очаквана стойност) е положителна, залогът има смисъл.
За по-прецизен модел можеш да ползваш и Monte Carlo симулации, при които правиш хиляди случайни симулации на мача и получаваш разпределение на резултатите.
Пойсоновото разпределение не гарантира печалба – дори с добър модел, вариацията е реална и трябва да управляваш банкрола отговорно.
ЧЕСТO ЗАДАВАНИ ВЪПРОСИ
ТРЯБВА ЛИ ДА ЗНАМ ВИСША МАТЕМАТИКА, ЗА ДА ПОЛЗВАМ МОДЕЛА?
Не. Формулата може да се пресметне в Excel с функцията POISSON.DIST(k, λ, FALSE). Въведи k (броя голове) и λ (средната стойност) и получаваш вероятността директно. Разбирането на математиката зад нея помага, но не е задължително.
РАБОТИ ЛИ МОДЕЛЪТ ЗА ДРУГИ СПОРТОВЕ?
Да, с резерви. Работи добре за хокей на лед (малко голове, независими). По-слабо за баскетбол (много точки, по-зависими). За тенис не е подходящ изобщо – структурата на игрите е напълно различна. За голове в ръгби и хандбал дава груба оценка.
КАК ДА НАМЕРЯ Λ ЗА КОНКРЕТЕН МАЧ?
Изчисли Attack Strength на домакина (средно бележени голове / средно за лигата) и Defense Strength на госта (средно допуснати голове / средно за лигата). λ_домакин = Attack_домакин × Defense_гост × Средна за лигата. Ползвай данни от последните 5-10 домакински мача за по-актуален показател.
КОЛКО ТОЧЕН Е МОДЕЛЪТ?
Изследвания показват, че Пойсоновият модел предвижда правилно точния резултат в около 18-22% от случаите – значително над случайното. При пазари като „над/под 2.5 гола“ точността може да е 55-60% при добра λ оценка. Важно е обаче да се ползва като филтър, не като оракул.
ЗАЩО ТОЧЕН РЕЗУЛТАТ 0:0 Е ПО-ВЕРОЯТЕН ОТКОЛКОТО ИЗГЛЕЖДА?
При λ = 1.1 за всеки отбор, P(0:0) = e^(-1.1) × e^(-1.1) ≈ 33% × 33% ≈ 11%. Букмейкърите обикновено предлагат коефициент около 9.00-10.00 за 0:0, което съответства на 10-11%. Рядко има стойност там, но моделът помага да потвърдиш дали коефициентът е справедлив.