Thống kê chất lượng: Bàn thắng kỳ vọng (xG)

bởi Vi Đan ·

Hãy tưởng tượng ra một trận đấu như sau: đội A gặp đội B, đội A tung ra 20 cú dứt điểm về phía khung thành đội B, còn đội B chỉ tung ra 1 cú dứt điểm duy nhất suốt 90 phút. Bây giờ, hãy suy đoán xem đội nào giành chiến thắng trong trận đấu này, dựa vào dữ liệu nói trên.

Hẳn các bạn cũng nhận ra rằng, nếu nghĩ kỹ, rất có thể dữ liệu về số lần dứt điểm kia chẳng có bất kỳ ý nghĩa nào. Chúng ta đều đã theo dõi những trận đấu mà một đội cầm trịch thế trận, tấn công không biết mệt mỏi mà chẳng ghi được bàn. Ngược lại, đội dựng xe buýt có một tình huống đá phạt trực tiếp và chuyển hóa thành công.

Những con số thống kê thông thường, cũng vì vậy, rất đáng bị nghi ngờ. Lý do rất đơn giản: chúng đưa ra thông tin về số lượng chứ không phải chất lượng. Trong trường hợp nói trên, đội A đã có 20 lần dứt điểm nhưng chất lượng của nó thì kém 1 lần dứt điểm của đội B.

Ảnh: Chris Brunskill Ltd

Iceland dứt điểm trúng đích ít hơn Bồ Đào Nha, không có nghĩa là Iceland thua hay Bồ Đào Nha thắng – Ảnh: Chris Brunskill Ltd

Lý do là bởi không phải cú dứt điểm nào cũng mang chất lượng như nhau, có điều kiện và hoàn cảnh như nhau. Một cú sút penalty chắc chắn khác hẳn một cú sút trái kèo từ cự ly 30 mét, dưới áp lực tì đè, che chắn của bên phòng ngự. Nói thẳng ra là dễ thực hiện hơn, nên dễ ghi bàn hơn.

Vậy làm sao để biết được chất lượng của các cú dứt điểm, hay nhìn rộng ra là chất lượng của một đội bóng? Liệu các con số thống kê có thể phục vụ được nhu cầu thông tin này?

Nếu bạn ưa thích những bài viết mùi mẫn thì hãy dừng lại tại đây. Nhưng nếu bạn tin vào khoa học hoặc đơn thuần là muốn tìm hiểu một góc nhìn khác về bóng đá, về số liệu thống kê thì hãy cùng nhau đi tiếp. Tôi hứa rằng mọi thứ trong bài viết này sẽ được diễn giải một cách dễ hiểu nhất có thể.

“Bàn thắng kỳ vọng” (xG) là gì?

Và sự thực là nó cũng không hề phức tạp. Khái niệm tôi muốn giới thiệu ở đây có tên là “Bàn thắng kỳ vọng”, hay trong tiếng Anh là “Expected Goals” (viết tắt: “xG” hoặc “ExpG”).

Rất đơn giản: khi xem bóng đá, hẳn đã có những lúc bạn thốt lên rằng, “đáng lẽ cú sút đó phải vào rồi”, hoặc “dễ như thế mà hỏng ăn”, hay “thủ môn mà không xuất sắc thì vào mịa rồi”. Bàn thắng kỳ vọng chính là thống kê cụ thể hóa điều này.

Trước khi đi vào giới thiệu kỹ càng, tôi muốn khẳng định rằng, xG là một sản phẩm được sáng tạo và phát triển bởi các chuyên gia thống kê Michael Caley, Paul Riley, 11tegen11. Hãy tìm và theo dõi họ trên Twitter.

Họ đã nhiều lần trình bày khái niệm này trong diễn đàn OptaPro. “Bàn thắng kỳ vọng” đã được chứng minh là loại thống kê đáng tin cậy hơn cả để chứng minh chất lượng thi đấu của một đội bóng so với những con số phổ biến như điểm số, số lần dứt điểm, số bàn thắng, số bàn thua…

Hiểu một cách đơn giản nhất, “bàn thắng kỳ vọng” là giá trị thể hiện “khả năng thành công của một cú dứt điểm trúng đích”.

“Dứt điểm”, tức bao gồm toàn bộ các pha đưa bóng về phía khung thành đối phương dù nó được thực hiện bằng chân, đầu hay đầu gối.

Các nhà thống kê đã chia vùng vị trí hoặc phân loại tính chất các cú dứt điểm được thực hiện để tính toán tỉ lệ thành công, qua đó đưa ra giá trị xG cho từng cú dứt điểm.

Trong bài viết này, chúng ta sẽ sử dụng nguồn số liệu của tác giả BassTunedToRed viết trên Tomkins Times. Anh tính toán dựa trên 3.231 cú dứt điểm trúng đích đã được thực hiện trong 380 trận đấu Premier League mùa giải 2015-16.

Các cú dứt điểm được BassTunedToRed phân loại như sau:

xG zone BassTunedToRed

Màu đỏ: trung tâm vòng cấm; màu xanh lá: hai bên vòng cấm; màu tím: trung lộ, ngoài vòng cấm; màu trắng: các khu vực khác
Phân loại Tỷ lệ thành bàn Giá trị xG
Penalty 87% 0.87
Cơ hội rõ ràng 59% 0.59
Trung tâm vòng cấm 28% 0.28
Hai bên vòng cấm 17% 0.17
Trung lộ, ngoài vòng cấm 15% 0.15
Khác 11% 0.11

Chú ý: “cơ hội rõ ràng” (“clear cut chance”) ở đây hiểu là những tình huống chỉ còn đối mặt thủ môn, những pha dứt điểm không ai kèm cặp và chỉ còn thủ môn để vượt qua, những tình huống dứt điểm cận thành mà hoàn toàn thoải mái, trống trải.

Giải thích thêm cho bảng trên: 87% các cú dứt điểm trúng đích là penalty đã thành bàn, tương tự cho các cột còn lại.

Ví dụ: Đội X có 3 cú dứt điểm trúng đích, trong đó có 1 quả phạt đền, 1 tình huống dứt điểm tại trung tâm vòng cấm và 1 tình huống từ khu vực khác. Như vậy, số bàn thắng kỳ vọng (xG) của đội X trong trận đấu đó là 1.26.

Với cách phân loại này, hẳn các bạn đã nhanh chóng nhận ra tính chất thực tế của xG. Nó rất chuẩn với mọi quan niệm mơ hồ, cảm tính.

Một cú dứt điểm trúng đích không bao giờ đồng nghĩa với một bàn thắng chắc chắn. Nhưng một cú dứt điểm trúng đích từ chấm 11 mét thì khả năng thành công sẽ là rất lớn – chính xác là lớn nhất.

Trong khi đó, càng gần khung thành và góc dứt điểm càng rộng thì khả năng ghi bàn càng cao – số “bàn thắng kỳ vọng” càng lớn.

Với một trận đấu, chúng ta sẽ thu được xG của hai đội, và khi so sánh hai giá trị xG này, khả năng đoán chính xác đội thắng trận là lớn hơn nhiều so với bất kỳ loại giá trị thống kê phổ biến nào khác. Nếu đội A có số bàn thắng kỳ vọng thấp hơn đội B, rất nhiều khả năng là A thua B.

đã được chứng minh là có khả năng dự đoán kết quả trận đấu hơn hẳn việc so sánh số lần dứt điểm hay thời lượng kiểm soát bóng – những loại thống kê chỉ mang tới giá trị về số lượng. Nói đơn giản thì, thắng về xG cũng nhiều khả năng mang tới chiến thắng đời thực.

Ví dụ: A đối đầu B, đội A có xG là 0.15 và đội B có xG là 0.87. B thắng A về xG, như vậy nhiều khả năng B thắng A ngoài đời thực, bất chấp B có dứt điểm nhiều hơn A hay không, hoặc B cầm bóng nhiều hơn hay ít hơn A hay không.

Đó là lý do vì sao xG lại đang trở thành một trong những loại thống kê được các chuyên gia hàng đầu tin cậy nhất. Nó đơn giản, dễ hiểu, không khó để trình bày với người hâm mộ thông thường và vô cùng thực tế.

Thử nghiệm phân tích: Premier League

Trong phần này, chúng ta sẽ thấy rõ hơn vì sao xG lại là con số thể hiện chất lượng tốt hơn so với các thống kê phổ biến khác. Và còn gì dễ hiểu hơn nếu lấy ngay nhà vô địch Premier League 2015-16, Leicester City huyền thoại, làm ví dụ?

Chúng ta đều quen thuộc với khái niệm “hiệu số bàn thắng-bàn bại”, tức giá trị có được khi lấy số lần ghi bàn trừ đi số lần thủng lưới. Khái niệm tương tự của nó cho các cú dứt điểm là hiệu số tung ra-nhận phải, tức giá trị có được khi lấy số lần dứt điểm về phía khung thành đối thủ trừ đi số lần bị đối thủ dứt điểm.

Nếu dựa vào hiệu số dứt điểm tung ra-nhận phải này, chúng ta dễ thấy rằng Leicester City xếp thứ 10 tại giải. Số lần dứt điểm của họ chỉ xếp thứ 6 tại Premier League, còn số lần phải nhận cú dứt điểm từ đối thủ thì xếp thứ 14. Vậy phải chăng Leicester đã giành chức vô địch một cách may mắn?

Nhưng như đã nói, những con số này chỉ cho thấy số lượng chứ không cho thấy chất lượng. Sử dụng hệ thống tính giá trị xG của BassTunedToRed, dễ thấy Leicester đứng thứ tư về hiệu số bàn thắng kỳ vọng (lấy số bàn thắng kỳ vọng ghi được của Leicester trừ đi số bàn thắng kỳ vọng phải nhận). Họ góp mặt trong top 4! Sự khác biệt là rất lớn.

Bảng dưới đây sắp xếp theo thứ tự hiệu số xG từ lớn tới nhỏ:

xG Premier League 2015-16

Bảng hiệu số xG tại Premier League 2015-16

Như vậy, xG dự đoán chính xác về top 4 Premier League, chính xác 2/3 đội xuống hạng.

Tuy nhiên, nếu chỉ dừng lại tại đây, có thể các bạn sẽ cảm thấy chưa ổn, phải không. Vì sao Tottenham nhất về hiệu số xG mà không vô địch? Leicester chỉ xếp thứ tư kia mà? Vì sao Newcastle xếp cao thế mà lại xuống hạng?

Rùa và đen

Các câu hỏi trên tồn tại là bởi bóng đá sau cùng vẫn là một bộ môn khó dự đoán nhất quả đất. Số bàn thắng kỳ vọng chỉ tiến tới điều gần chính xác và tiệm cận chứ không thể hình dung hết được những phút xuất thần hay những sai lầm ngớ ngẩn.

Ví dụ, ai mà tin rằng cú sút “ấy” của Maicon tại World Cup 2010 có thể thành bàn?

Và rồi xG không thể hiện được sai lầm của Marc Andre ter Stegen ở 00:09 trong video này:

Có thể nói rằng bàn thắng của Maicon mang màu sắc may mắn (dù anh cố ý hay vô tình dứt điểm). Ngược lại, pha để thua của ter Stegen là một sự xui xẻo của thủ môn này.

Khai thác xG dựa trên góc độ này, chúng ta cũng có thể dễ dàng nhận ra những đội “rùa” và những đội “đen” nhất. Cách tính rất đơn giản: dựa vào kết quả đối đầu xG và kết quả thực. Nếu xG lớn hơn mà thua, hãy tạm coi rằng đội bóng đó xui xẻo. Ngược lại, đội có xG nhỏ hơn mà thắng, hãy tạm coi rằng họ may mắn.

Chúng ta sẽ có bảng thông kê như sau về Premier League 2015-16:

ExpG-Lucky-Wins

Thắng rùa, thua đen dựa trên xG – Ảnh: BassTunedToRed

Tottenham đã thua 6 trận trong mùa trước, nhưng dựa vào xG để dự đoán thì đáng lẽ ra 5 trong số đó phải là những chiến thắng. Trận đấu mở màn mùa giải của họ là một minh họa tiêu biểu: Tottenham gặp Manchester United, chơi nhỉnh hơn nhưng sau cùng không được điểm nào vì một pha phản lưới nhà.

Và các bạn hâm mộ Manchester United, hãy an tâm rằng đội của các bạn không phải đội “rùa” nhất Premier League mùa qua. Đó là West Ham, đội từng bị chuyên gia Joel Salamon chê ngay từ đầu giải dựa trên xG.

Đúng sức và dưới sức

Nhưng nếu có cổ động viên nào của Man United vẫn muốn biện minh rằng trận thắng Tottenham kể trên là xứng đáng chứ không phải hòa, thì hãy để tôi làm thay.

Số bàn thắng kỳ vọng, dẫn sao đi chăng nữa, cũng chỉ là một loại thống kê không cảm xúc (Hồ Quang Hiếu). Mỗi người có thể nhìn vào nó theo một hệ qui chiếu, góc nhìn, nhân sinh quan, triết lý sống… khác nhau và qua đó giải nghĩa nó khác nhau.

Một cách có lợi để phân tích cho Man United trong trường hợp này, là có thể United đã chơi tốt hơn so với thực lực của họ. Đối đầu xG thua kém cho thấy rằng Tottenham hay hơn Man United trong trận đấu này, nhưng có thể Man United đã chơi với hơn 100% sức lực và giành 3 điểm xứng đáng?

Đặt vào góc độ ấy, chúng ta có bảng sau:

ExpG-Attack

“ExpG For” = số bàn thắng kỳ vọng ghi được; “Actual For” = số bàn thắng ghi được trên thực tế – Ảnh: BassTunedToRed

Nhìn vào đó, dễ thấy logic được lật ngược: West Ham có thể không phải đội “rùa” nhất giải mà là đội đã có màn trình diễn quyết tâm nhất, “trẻ em nghèo vượt khó” nhất – 115,7% công lực đã được tung ra.

Ngược lại, Arsenal xếp bét bảng. Dường như họ chỉ tung ra 85% khả năng thực sự? Đáng chú ý, Arsenal là đội duy nhất đã thắng Leicester City ở cả lượt đi và lượt về mùa qua (xét kết quả thực tế). Có thể tin rằng nếu đạt 100% khả năng, Arsenal đã vô địch chứ không chỉ xếp thứ nhì.

Một chi tiết khá bất ngờ là với cách phân tích trên, chúng ta thấy rằng Man City đã chơi với 112,4% khả năng. Chú ý là xG của chúng ta chỉ tính trong Premier League, vì vậy việc họ lần đầu lọt tới bán kết Champions League là không liên quan.

Con số trên cho thấy rằng rất có thể Man City tệ hơn thành tích thực rất nhiều – từ đây, có thể dẫn dắt ra rằng Pep Guardiola có nhiệm vụ khó khăn hơn nhiều so với tương quan thực tế. Không thể bao giờ cũng kỳ vọng vào may rủi hoặc “vượt qua chính mình”.

Nhưng bảng trên mới chỉ là xG ghi được, vậy còn xG phải nhận thì sao? Chúng ta có bảng dưới đây:

ExpG-Defence

“ExpG Against” = số bàn thua kỳ vọng; “Actual For” = số bàn thua phải nhận trên thực tế – Ảnh: BassTunedToRed

Nếu bạn thích sự mùi mẫn mà vẫn đọc đến tận đây, xin cám ơn và xin chúc mừng. Cliché tiêu biểu rằng “hàng công mang tới 3 điểm, hàng thủ mang tới chức vô địch” hoàn toàn chính xác khi nhìn qua góc độ này.

Leicester City đã tự vượt qua chính mình về khả năng phòng ngự, còn Newcastle United và Liverpool đã tự lý giải vì sao kết quả đường dài của họ dường như không khớp với thực lực.

So sánh cả hai bảng nói trên, chúng ta sẽ tiếp tục đi đến nhiều kết luận quan trọng khác. Một trong số đó là dường như Chelsea đã chơi tương đối đúng sức. Họ đạt 108% khả năng tấn công và 101.3% khả năng phòng ngự, tức hầu như rùa không đáng kể mà cũng chẳng đen đủi. Vậy mà họ chỉ xếp thứ 10 chung cuộc.

Họ thực sự chỉ đến mức như vậy? Jose Mourinho và Guus Hiddink nên bị nghi ngờ, bởi lối chơi của Chelsea hầu như không đổi trong cả mùa qua.

Cộng chung cả hai bảng, chúng ta có bảng tổng kết về mức độ thể hiện so với thực lực của các đội mùa qua như sau:

ExpG-VS-Reality

Ảnh: BassTunedToRed

Kết luận

Bàn thắng kỳ vọng là một loại thống kê đã nổi lên và chiếm được sự thừa nhận của đông đảo các chuyên gia trong lĩnh vực khoảng gần 2 năm vừa qua. Những điểm mạnh của nó đã được nêu phía trên.

Nhưng không phải xG không có điểm yếu. Điểm yếu dễ thấy nhất chính là việc nó không có giá trị đo đếm nhiều với các cầu thủ phòng ngự, bởi rõ ràng việc của họ không phải ghi bàn. Với một cầu thủ tấn công, chỉ cần làm những điều tương tự và chúng ta có thể rút ra kết luận rằng họ đã chơi đúng sức hay chưa. Ví dụ, Cristiano Ronaldo đã chơi dưới khả năng tại Euro 2016 vừa qua.

Một điểm yếu quan trọng nữa của xG là nó tương đối hạn chế với đại chúng nói chung và người hâm mộ tại Việt Nam nói riêng. Các nguồn dữ liệu thống kê mà các chuyên gia kể tên trong bài sử dụng hầu hết đều từ Opta. Phần lớn trong số họ đều đã góp mặt tại các diễn đàn OptaPro tổ chức tại Anh. Họ hoặc đã tự mua, hoặc làm việc cho một tổ chức đã mua dữ liệu của Opta, và thậm chí đã từng làm việc trực tiếp cho Opta.

Chúng ta sẽ phải chờ đợi vào họ để có được số liệu tổng thể, trừ khi tự mình ghi chép từng trận một dựa vào các nguồn như Squawka, WhoScored, StatsZone. Mà công việc ấy thì vô cùng cực nhọc.

Điểm yếu thứ ba của xG là nó dựa rất nhiều vào qui tắc phân loại cú dứt điểm trúng đích. Ngoài ra, giá trị xG của mỗi cú dứt điểm cũng rất có thể thay đổi theo từng mùa giải, giai đoạn khác nhau.

P/s: Bạn có thấy choáng (và buồn) khi biết rằng bóng đá ở nước ngoài đang bỏ xa Việt Nam đến đâu?

BÌNH LUẬN

TÁC GIẢ
Vi Đan
12 bài viết
“Ta mang cho em một điếu cần, cần thơm hay môi em thơm // Em mang cho ta một điếu cần, miệng cười khúc khích lâng lâng”
Phát bóng lên ^