Пойсоново разпределение – прогнозиране на голове с математика

Накратко

Пойсоновото разпределение е математически модел, с който изчисляваш точната вероятност дадено събитие да се случи определен брой пъти – например колко гола ще бележи отбор в мач. Ако знаеш средния брой голове на отбор (λ), формулата дава точните вероятности за 0, 1, 2, 3 или повече гола. Това е в основата на повечето сериозни футболни betting модели.

Какво е Пойсоново разпределение

Симеон-Дени Поасон (Siméon-Denis Poisson) е френски математик, живял в началото на 19-ти век. Неговото разпределение описва вероятността за определен брой независими събития в даден интервал от време или пространство – при условие, че средната честота на тези събития е известна.

Идеалното е при събития, които:

са редки спрямо потенциалния брой опити
са независими едно от друго
имат постоянна средна скорост (λ, ламбда)

Голбелязването в повечето футболни мачове отговаря на тези критерии достатъчно добре, за да направи модела приложим. Головете са относително редки (3-4 на мач средно за двата отбора), всеки гол е до голяма степен независим от предишния, и средните показатели на отборите са относително стабилни за даден период.

Именно затова Пойсоновото разпределение стои в основата на количествения анализ на очаквани голове и е инструмент за намиране на стойностни залози на пазари като „точен резултат“ и „брой голове“.

Формулата P(k) = λ^k × e^(-λ) / k!

P(k) = (λ^k × e^(-λ)) / k!

P(k) = вероятността за точно k гола
λ (ламбда) = очакван среден брой голове
e = числото на Ойлер ≈ 2.71828
k! = k факториел (k × (k-1) × … × 1)
k = конкретният брой голове, за който изчисляваш

Изглежда сложно, но е просто след като го видиш на практика. Нека разгледаме реален пример стъпка по стъпка.

Пример: Реал Мадрид

Вземаме Реал Мадрид в Ла Лига. За последния сезон отборът е бележил средно 2.1 гола на мач като домакин. Това е нашето λ = 2.1.

Искаме да изчислим колко вероятно е Реал Мадрид да вкара точно 2 гола в следващия домакински мач. Заместваме в формулата с k = 2:

λ^k = 2.1² = 4.41
e^(-λ) = e^(-2.1) = 0.1225
k! = 2! = 2 × 1 = 2
P(2) = (4.41 × 0.1225) / 2 = 0.5402 / 2 = 0.2700

Резултатът: 27% вероятност Реал Мадрид да вкара точно 2 гола. Ако букмейкърът предлага коеф 4.00 за „точно 2 гола Реал Мадрид”, честната цена би трябвало да е около 3.70 – тоест предложението е с отрицателна стойност и го пропускаш.

Изчисляваме по същия начин за всеки брой голове от 0 до 5+:

Голове (k)	Изчисление	Вероятност
0 гола	(1 × 0.1225) / 1	12.25%
1 гол	(2.1 × 0.1225) / 1	25.72%
2 гола	(4.41 × 0.1225) / 2	27.00%
3 гола	(9.261 × 0.1225) / 6	18.90%
4 гола	(19.45 × 0.1225) / 24	9.92%
5+ гола	1 – сума(0-4)	6.21%

Забележи: сборът на всички вероятности е точно 100%. Моделът е самопроверяващ се – ако сумата не е 100%, имаш грешка в изчислението.

Важно уточнение: λ = 2.1 е средна стойност за домакински мачове. За гостуващи мачове Реал Мадрид показва различна статистика – обикновено около 1.7-1.8 гола. Никога не ползвай общата средна стойност на отбора за двата вида мачове заедно, защото домакинското предимство изкривява модела.

Таблица с вероятности при различни λ

Стълбова диаграма показваща вероятностите за домакинска победа (52%), равенство (20%) и гостуваща победа (28%) по Пойсонов модел с λ=1.5 за домакина и λ=0.8 за госта — Изходите са изчислени чрез матрица на съвместните вероятности за всички резултати до 4:4. Данни: betstar.bg

Ето как изглеждат вероятностите при различни средни стойности λ:

k (гола)	λ = 0.8	λ = 1.2	λ = 1.5	λ = 2.0	λ = 2.3	λ = 3.0
0	44.9%	30.1%	22.3%	13.5%	10.0%	5.0%
1	35.9%	36.1%	33.5%	27.1%	23.1%	14.9%
2	14.4%	21.7%	25.1%	27.1%	26.5%	22.4%
3	3.8%	8.7%	12.6%	18.0%	20.3%	22.4%
4	0.8%	2.6%	4.7%	9.0%	11.7%	16.8%
5+	0.2%	0.8%	1.8%	5.3%	8.4%	18.5%

Диаграма

Два отбора – пълен мач модел

Силата на модела се проявява при изчисляване на пълен мач. Ако изчислиш вероятностите за головете на двата отбора независимо, можеш да получиш матрица с вероятностите за всеки точен резултат.

За да получиш λ за конкретен мач, вземаш средния атакуващ показател на домакина, умножен по средния отбранителен показател на госта, умножен по средния за лигата. Тази нормализация прави модела по-прецизен. Вижте как подразбиращата се вероятност от коефициентите се сравнява с вероятностите от Пойсоновия модел – разликата е потенциален стойностен залог.

Ограничения на модела

Моделът не е перфектен. Важно е да познаваш слабите му страни:

Приема независимост на голове – в действителност след 1:0 отборите може да играят по-отворено или по-затворено, което нарушава независимостта. Мачове „до края“ са по-трудни за моделиране.

Не отчита контекст – умора, наказания, форма в момента, дали мачът е финал или редовен кръг, ниво на мотивация. Тези фактори не са в числата.

Статични λ стойности – използваш средно от сезона, но форма варира. Отбор с λ = 2.0 може да е вкарал 5 гола миналите 3 мача или 0 гола.

Проблем с малки извадки – 5 мача не са достатъчни за надеждна λ. Трябват поне 15-20 мача. За статистически значими резултати е нужна достатъчно голяма извадка.

Въпреки ограниченията, Пойсоновият модел е отличен първи филтър при идентификация на потенциални стойностни залози на пазарите за голове и точни резултати.

Практическо приложение

Ето прост работен процес за прилагане на модела:

Стъпка 1: Събери данни. За всеки отбор изчисли средния брой бележени и допускани голове за последните 15-20 мача (home/away поотделно).

Стъпка 2: Нормализирай спрямо лигата. Раздели показателя на отбора на средния за лигата, за да получиш Attack Strength и Defense Strength.

Стъпка 3: Изчисли λ за всеки отбор. λ_домакин = Attack_домакин × Defense_гост × Средна за лигата (домакини).

Стъпка 4: Приложи Пойсоновата формула за k = 0, 1, 2, 3, 4, 5+.

Стъпка 5: Изгради матрица с точни резултати и сравни с коефициентите на букмейкъра.

Ако намериш резултат, при който моделът дава 10% вероятност, но букмейкърът дава коефициент 12.00 (= 8.33% вероятност), имаш потенциален стойностен залог. Свържи с концепцията за очаквана стойност – ако EV (очаквана стойност) е положителна, залогът има смисъл.

За по-прецизен модел можеш да ползваш и Monte Carlo симулации, при които правиш хиляди случайни симулации на мача и получаваш разпределение на резултатите.

Пойсоновото разпределение не гарантира печалба – дори с добър модел, вариацията е реална и трябва да управляваш банкрола отговорно.

ЧЕСТO ЗАДАВАНИ ВЪПРОСИ

ТРЯБВА ЛИ ДА ЗНАМ ВИСША МАТЕМАТИКА, ЗА ДА ПОЛЗВАМ МОДЕЛА?

Не. Формулата може да се пресметне в Excel с функцията POISSON.DIST(k, λ, FALSE). Въведи k (броя голове) и λ (средната стойност) и получаваш вероятността директно. Разбирането на математиката зад нея помага, но не е задължително.

РАБОТИ ЛИ МОДЕЛЪТ ЗА ДРУГИ СПОРТОВЕ?

Да, с резерви. Работи добре за хокей на лед (малко голове, независими). По-слабо за баскетбол (много точки, по-зависими). За тенис не е подходящ изобщо – структурата на игрите е напълно различна. За голове в ръгби и хандбал дава груба оценка.

КАК ДА НАМЕРЯ Λ ЗА КОНКРЕТЕН МАЧ?

Изчисли Attack Strength на домакина (средно бележени голове / средно за лигата) и Defense Strength на госта (средно допуснати голове / средно за лигата). λ_домакин = Attack_домакин × Defense_гост × Средна за лигата. Ползвай данни от последните 5-10 домакински мача за по-актуален показател.

КОЛКО ТОЧЕН Е МОДЕЛЪТ?

Изследвания показват, че Пойсоновият модел предвижда правилно точния резултат в около 18-22% от случаите – значително над случайното. При пазари като „над/под 2.5 гола“ точността може да е 55-60% при добра λ оценка. Важно е обаче да се ползва като филтър, не като оракул.

ЗАЩО ТОЧЕН РЕЗУЛТАТ 0:0 Е ПО-ВЕРОЯТЕН ОТКОЛКОТО ИЗГЛЕЖДА?

При λ = 1.1 за всеки отбор, P(0:0) = e^(-1.1) × e^(-1.1) ≈ 33% × 33% ≈ 11%. Букмейкърите обикновено предлагат коефициент около 9.00-10.00 за 0:0, което съответства на 10-11%. Рядко има стойност там, но моделът помага да потвърдиш дали коефициентът е справедлив.