Dự đoán hay nhận định bóng đá qua thống kê (Statistical association football predictions) là một phương pháp dự đoán kết quả của các trận đấu bóng đá bằng các công cụ thống kê.

Mục tiêu của dự đoán bóng đá qua thống kê là làm tốt hơn dự đoán của các nhà cái.

Phương pháp thống kê được sử dụng rộng rãi nhất để dự đoán là xếp hạng.

Hệ thống xếp hạng bóng đá ấn định thứ hạng cho mỗi đội dựa trên kết quả trận đấu trong quá khứ, đội được hỉ định  mạnh nhất là đội có thứ hạng cao nhất. 

Kết quả của trận đấu có thể được dự đoán bằng cách so sánh cấp bậc / giá trị của các đối thủ.

Hiện nay, có rất nhiều hệ thống xếp hạng bóng đá, ví dụ như một số hệ thống được biết đến rộng rãi là bảng xếp hạng thế giới FIFA hoặc Elo.

Có ba nhược điểm chính đối với dự đoán trận đấu bóng đá dựa trên hệ thống xếp hạng:

  • Thứ hạng được giao cho các đội không phân biệt sức mạnh tấn công và phòng thủ của họ.
  • Thứ hạng là điểm trung bình tích lũy không tính đến sự thay đổi kỹ năng của các đội bóng đá.
  • Mục tiêu chính của hệ thống xếp hạng không phải là dự đoán kết quả của các trận bóng đá mà là để phân loại các đội theo sức mạnh trung bình của họ.

Ngoài ra, còn một cách khác để dự đoán bóng đá là hệ thống đánh giá.

Trong khi xếp hạng chỉ đề cập đến thứ tự đội, hệ thống xếp hạng chỉ định cho mỗi đội một chỉ số sức mạnh được chia theo tỷ lệ liên tục. 

Hơn nữa, đánh giá có thể được sử dụng không chỉ cho một đội mà còn cho sức mạnh tấn công và phòng thủ, lợi thế sân nhà hoặc thậm chí là kỹ năng của mỗi cầu thủ trong đội.

Lịch sử hình thành

lich su hinh thanh 2

Các ấn phẩm về mô hình thống kê cho dự đoán bóng đá bắt đầu xuất hiện từ những năm 90.

Nhưng mô hình đầu tiên được đề xuất sớm hơn cả là từ Moroney (người đã xuất bản phân tích thống kê đầu tiên của mình về kết quả trận đấu bóng đá vào năm 1956).

Theo phân tích của Moroney, cả phân phối Poisson và âm phân phối nhị thức cung cấp những dự đoán phù hợp cho kết quả của các trò chơi bóng đá.

Chuỗi chuyền bóng giữa các cầu thủ trong các trận đấu bóng đá đã được Reep và Benjamin phân tích thành công bằng cách sử dụng phân phối nhị thức âm vào năm 1968.

Họ đã cải tiến phương pháp này vào năm 1971.

Năm 1974, Hill chỉ ra rằng kết quả trận bóng ở một mức độ nào đó có thể dự đoán được và không chỉ đơn giản là vấn đề may rủi.

Mô hình đầu tiên dự đoán kết quả của các trận đấu bóng đá giữa các đội có kỹ năng khác nhau được Michael Maher đề xuất vào năm 1982. 

Theo mô hình của ông, các bàn thắng mà đối thủ ghi được trong trận đấu được rút ra từ phân phối Poisson.

Các thông số của mô hình được xác định bởi sự khác biệt giữa kỹ năng tấn công và phòng thủ, được điều chỉnh bởi yếu tố lợi thế sân nhà.

Các phương pháp mô hình hóa yếu tố lợi thế sân nhà được Caurneya và Carron tóm tắt trong một bài báo vào năm 1992.

Năm 1999, Knorr-Held đã phân tích về “Sự phụ thuộc vào thời gian của sức mạnh của đội”.

Ông sử dụng ước lượng đệ quy Bayes để đánh giá các đội bóng: phương pháp này thực tế hơn so với việc dự đoán bóng đá dựa trên số liệu thống kê trung bình.

Các phương pháp dự đoán bóng đá

cac phuong phap du doan bong da

Tất cả các phương pháp dự đoán có thể được phân loại theo các hình thức giải đấu khác nhau, sự phụ thuộc vào thời gian và thuật toán hồi quy.

Các phương pháp dự đoán bóng đá được phỏng đoán có sự khác nhau giữa giải đấu Round-robin và giải đấu Knockout.

Diego Kuonen đã từng tổng hợp trong một bài báo về các phương pháp thi đấu Knockout.

Dưới đây là phương pháp dự đoán trong các giải đấu Round-robin:

  • TILS (Time Independent Least Squares Rating): Sử dụng thuật toán hồi quy là hồi quy bình phương tuyến tính nhỏ nhất
  • TIPR (Time Independent Poisson Regression): Sử dụng thuật toán hồi quy dựa trên khả năng tối đa.
  • TISR ( Time Independent Skellam Regression): Định nghĩa tương tự như TIPR
  • TDPR (Time Independent Skellam Regression): Nội dung giống với TIPR và TISR, nhưng đặc biệt, riêng TDPR thời gian phụ thuộc là hệ số bán phá giá theo thời gian
  • TDMC (Time-Dependent Markov Chain) 

Thời gian phụ thuộc dựa trên mô hình chuỗi Markov.

thoi gian phu thuoc dua tren mo hinh chuoi markov

Phương pháp này có ý định chỉ định cho mỗi đội trong giải đấu một giá trị xếp hạng được chia tỷ lệ liên tục, để đội mạnh nhất sẽ có điểm xếp hạng cao nhất.

Phương pháp dựa trên giả định rằng xếp hạng được ấn định cho các đội đối thủ tỷ lệ thuận với kết quả của mỗi trận đấu.

Giả sử rằng các đội A, B, C và D đang thi đấu trong một giải đấu và kết quả trận đấu như sau:

Trận đấu

#

Đội nhà Điểm Đội khách Y
1 A 3-1 B Y1 = 3-1
2 C 2-1 D Y2 = 2-1
3 D 1-4 B Y3 + 1-4
4 A 3-1 D Y4 = 3-1
5 B 2-0 C Y5 = 2-0

Mặc dù xếp hạng rA, rB, rC và rD của các đội A, B, C và D tương ứng là không xác định, nhưng có thể giả định rằng kết quả của trận đấu số 1 tỉ lệ thuận với sự khác biệt giữa thứ hạng của các đội A và B: y1 = rA – rB + ε1

Theo cách này, y1 tương ứng với sự khác biệt về điểm số và ε1 là sự quan sát tiếng ồn. Giả định tương tự có thể được thực hiện cho tất cả các trận đấu trong giải đấu:

y1 = rA – rB + ε1

y2 = rC – rD + ε2

y5 = rB – rC + ε5

 

Bằng cách đưa vào ma trận lựa chọn X, các phương trình trên có thể được viết lại ở dạng nhỏ gọn:

Y = Xr + e

Các mục của ma trận lựa chọn có thể là 1, 0 hoặc -1, với 1 tương ứng với đội chủ nhà và -1 tương ứng với đội khách.

Nếu ma trận có hạng đầy đủ, nghiệm đại số của hệ thống có thể được tìm thấy thông qua phương pháp bình phương tối thiểu. Nếu không, người ta có thể sử dụng nghịch đảo Moore – Penrose.

Các thông số xếp hạng cuối cùng là

r = [1.625, 0.75, −0.875, −1.5]T

Trong trường hợp này, đội mạnh nhất có xếp hạng cao nhất.

Ưu điểm của phương pháp xếp hạng này so với các hệ thống xếp hạng tiêu chuẩn là các con số được chia theo tỷ lệ liên tục giúp xác định sự khác biệt chính xác giữa sức mạnh của các đội. 

Hồi quy Poisson không phụ thuộc vào thời gian

Theo mô hình này (Maher), nếu Xi, j và Yi, j là các bàn thắng được ghi trong trận đấu mà đội i đấu với đội j.

Xi và Yi, j là các biến ngẫu nhiên độc lập có nghĩa là λ và μ. Do đó, xác suất chung của việc đội nhà ghi được x bàn và đội khách ghi được y bàn là tích của hai xác suất độc lập.

Giả sử rằng C biểu thị số đội tham gia trong một mùa giải và N là số trận đấu đã chơi cho đến thời điểm hiện tại, sức mạnh của đội có thể được ước tính bằng cách tối thiểu hóa hàm log-khả năng âm đối với λ và μ.

Vì đã biết Xn và Yn, nên sức mạnh tấn công và phòng thủ của đội (ai, di) và lợi thế sân nhà (h) giúp giảm thiểu khả năng xảy ra các trường hợp tiêu cực có thể được ước tính bằng cách tối đa hóa kỳ vọng.

Các cải tiến cho mô hình này được đề xuất bởi nhà thống kê Mark Dixon và Stuart Coles.

Họ đã phát minh ra một hệ số tương quan cho các tỷ số thấp 0-0, 1-0, 0-1 và 1-1, nơi mà mô hình Poisson độc lập không giữ được. 

Dimitris Karlis và Ioannis Ntzoufras đã xây dựng mô hình phân phối Skellam không phụ thuộc vào thời gian.

Không giống như mô hình Poisson – phù hợp với việc phân bổ điểm số, mô hình Skellam phù hợp với sự khác biệt giữa tỷ số sân nhà và sân khách.

Nếu bạn yêu thích giao diện đơn giản, bảo mật uy tín và tỷ lệ trả thưởng hấp dẫn thì nhà cái KTO Châu Á chính là chân ái dành cho bạn. Truy cập ngay để rinh tiền nhé!

Chuỗi Markov phụ thuộc vào thời gian Monte Carlo

Một mặt, các mô hình thống kê yêu cầu một số lượng lớn các quan sát để ước tính chính xác các tham số của nó. Và khi không có đủ số lượng quan sát có sẵn trong một mùa (như tình hình thường xảy ra), thì việc làm việc với số liệu thống kê trung bình có ý nghĩa.

Mặt khác, ai cũng biết rằng các kỹ năng của đội thay đổi trong mùa giải, khiến các thông số của mô hình phụ thuộc vào thời gian. Mark Dixon và Coles đã cố gắng giải quyết sự đánh đổi này bằng cách gán trọng số lớn hơn cho kết quả trận đấu gần nhất.

Rue và Salvesen đã giới thiệu một phương pháp đánh giá phụ thuộc thời gian mới bằng cách sử dụng mô hình Chuỗi Markov.

Theo mô hình, sức mạnh tấn công (a) của đội A có thể được mô tả bằng phương trình chuẩn của chuyển động Brown, Ba, A (t), trong thời gian t1> t0.

Giả sử rằng ba đội A, B và C đang thi đấu trong giải đấu và các trận đấu được diễn ra theo thứ tự sau: t0: A-B; t0: A-C; t1: B-C, mật độ xác suất khớp có thể được biểu thị.

Vì việc ước lượng phân tích các tham số sẽ khó trong trường hợp này, phương pháp Monte Carlo được áp dụng để ước lượng các tham số của mô hình.

Ứng dụng cho các môn thể thao khác

ung dung cho cac mon the thao khac

Các mô hình được sử dụng cho hiệp hội bóng đá có thể được sử dụng cho các môn thể thao khác có cùng số bàn thắng (điểm), chẳng hạn như khúc gôn cầu trên băng, bóng nước, khúc gôn cầu trên sân, bóng sàn, v.v.

Xây dựng dựa trên nghiên cứu về Maher (1982), Dixon và Coles (1997) và những người khác đã sử dụng các mô hình cho bóng đá hiệp hội.

Họ đã giới thiệu bốn mô hình cho môn khúc côn cầu trên băng:

  • Mô hình phân phối Poisson kép (giống như Maher 1982).
  • Mô hình phân phối Poisson lưỡng biến sử dụng tổng quát hóa phân phối Poisson hai biến cho phép tương quan nghịch giữa các biến ngẫu nhiên (phân phối này được giới thiệu trong Famoye (2010).
  • Các phiên bản thổi phồng theo đường chéo của hai mô hình trước đó (lấy cảm hứng từ Dixon và Coles (1997) trong đó xác suất của các mối quan hệ 0:0, 1:1, 2:2, 3:3, 4:4 và 5:5 được mô hình hóa với các tham số bổ sung.

Các thông tin cũ hơn (kết quả) được chiết khấu trong quá trình ước tính trong cả bốn mô hình.

Các mô hình được trình diễn trong giải đấu khúc gôn cầu trên băng cấp cao nhất ở Cộng hòa Séc – Czech Extraliga giữa các mùa giải 1999/2000 và 2011/2012. Kết quả được sử dụng thành công trong việc cá cược giả tưởng chống lại các nhà cái.

Lời kết

Bài viết trên đã cung cấp cho bạn những thông tin cần thiết nhất về mô hình dự đoán bóng đá kết hợp thống kế. Bạn có thể áp dụng những kiến thức này vào các trận cược của mình để có thể chiến thắng nhà cái đấy,

Kèo nhà cái KTO chúc bạn thật nhiều niềm vui và may mắn trên con đường sắp tới nhé!

Bạn có thể tham khảo thêm các bài viết tại chuyên mục Kiến Thức Cá Cược để bổ sung các thông tin hữu ích khác.

>> Xem thêm: Thuật toán cá cược

Nguồn: https://en.wikipedia.org/wiki/Statistical_association_football_predictions


Chuyên mục

THẺ TAG


Để lại bình luận

Your email address will not be published.

{"email":"Email không hợp lệ","url":"Website không hợp lệ","required":"Chưa nhập thông tin"}

Bài viết liên quan