Tư duy phân tích số liệu thống kê bóng đá

bởi Dũng Lê ·

Bài viết sử dụng tư liệu từ bài viết của Michael Caley trên StatsBomb.

Sự xuất hiện của những con số thống kê trên mặt báo, kênh truyền hình đang khiến cho người hâm mộ bóng đá thông thường dần nhận ra rằng, bằng một cách nào đó, chúng ta hoàn toàn có thể nghiên cứu bóng đá như một bộ môn khoa học. Sự ra đời của những website như WhoScored, Squawka, FourFourTwo StatsZone… lại càng mang tới nhiều số liệu thô hơn nữa. Dĩ nhiên đó thậm chí còn chưa bằng một góc những gì mà Opta, ProZone, StatsDNA, SportsRadar… có thể mang lại.

Thế nhưng, việc đem ra xem xét những con số thô luôn là một sai lầm dễ mắc phải. Ví dụ, chúng ta có con số rằng Lucas Leiva tắc bóng 5 lần/trận. Đó nghe chừng là một con số lớn. Tuy nhiên, nó không thể là thước đo để kết luận rằng Lucas Leiva là một cầu thủ giỏi, hay cụ thể hơn là một cầu thủ tắc bóng giỏi. Bởi cú tắc bóng của anh ta hoàn toàn có thể xảy ra ở một vị trí quá xa so với các đồng đội.

lucas leiva

Ảnh: Twitter

Sau cú tắc bóng thành công, Lucas có thể đã nối tiếp nó bằng một đường chuyền hỏng và khiến đội nhà gặp nguy hiểm. Hay thậm chí, anh ta không cần phải rời xa vị trí gốc chỉ để đi tắc bóng! Vân vân và vân vân. Người hâm mộ Liverpool hẳn đều hiểu rằng Lucas không phải một cầu thủ đẳng cấp hàng đầu – theo bất kỳ nghĩa nào của từ “hàng đầu”.

Vậy khi nhìn thấy những số liệu thô, chúng ta phải tư duy như thế nào?

Tư duy xử lý số liệu

Dĩ nhiên, con đường tư duy sẽ bắt đầu bằng câu hỏi: Trên sân, đâu là những điểm quan trọng cần lưu ý? Nối sau đó sẽ là: Có những gì liên quan, tạo nên điều quan trọng đó? Và có thể là: Hành động nào của cầu thủ khiến cho điều quan trọng này xảy ra?

Ví dụ, một chi tiết tối quan trọng mà bất kỳ ai cũng quan tâm là các bàn thắng. Với một số “chuyên gia phân tích”, bàn thắng là tất cả những gì họ quan tâm. Hãy tưởng tượng một nhóm học sinh cấp 1 cùng nhau tư duy về thống kê bàn thắng.

Cô giáo: – Nào các con, hôm nay chúng ta sẽ nói về bóng đá. Một cựu tuyển thủ quốc gia trên sóng truyền hình nói rằng chúng ta quan tâm tới bàn thắng hơn bất kỳ thứ gì. Vậy thì theo các con, cái gì tạo nên bàn thắng?

– Thưa cô là dứt điểm, dứt điểm thì mới có bàn thắng!

– Giỏi lắm bé Tèo. Chắc con không nhớ cứ chú cựu tuyển thủ kia khi còn chơi bóng cũng là tiền đạo đấy, ghi nhiều bàn lắm. Nhưng làm sao để chú ấy dứt điểm được hả con?

– Kiến tạo! Kiến tạo là các đường chuyền đưa bóng tới cho chú ấy dứt điểm! Chúng ta phải để ý kiến tạo!

– Giỏi lắm Tèo. Như vậy là chúng ta phải theo dõi các bàn thắng, các cú dứt điểm và các pha kiến tạo. Nhưng bây giờ hãy thử nhìn từ góc độ khác. Khi tấn công thì các cầu thủ hay làm gì?

– Ơ… dạ… họ đánh cùi chỏ người khác ạ?

– Cô biết con thích Diego Costa mà Tí. Nhưng Tí ạ, đấy không phải thứ ai cũng làm.

– Họ rê bóng ạ?

– Giỏi lắm Tú. Vậy các con có đồng ý rằng để ghi được bàn thì phải dứt điểm, phải kiến tạo và phải rê dắt bóng không?

– Có ạ ạ ạ ạ ạ!

Viễn cảnh này nghe có vẻ hơi gượng, nhưng đó chính là cách tư duy đầu tiên của những nhà thống kê bóng đá đầu tiên xuất hiện từ nửa cuối thế kỷ 20. Không tồi, bởi đó là một chuỗi suy luận nghe có vẻ tương đối logic.

Và thế là nó được truyền đạt như sau: Muốn biết ai là cầu thủ tấn công giỏi ư? Hãy nhìn vào số lần dứt điểm, số đường chuyền tạo cơ hội dứt điểm (key pass) và số pha qua người. Nhìn vào đó và chúng ta sẽ thấy ngay ai là cầu thủ tấn công giỏi.

Ví dụ, dưới đây là hai cầu thủ khá toàn diện theo logic ấy, số liệu của họ cho 3 điểm này cũng là khá cao:

  Dứt điểm Tạo cơ hội Qua người
Neymar 3,29 1,82 3,64
Andros Townsend 4,1 1,98 4,98

(Số liệu tính trong 2 mùa giải 2013-2015)

Cứ theo chuỗi tư duy logic phía trên, chúng ta có thể nhận thấy rằng hai cầu thủ này tuy ngang tuổi nhưng dường như Andros Townsend có phần trội hơn Neymar.

Tuyệt vời.

Đây chỉ là một ví dụ rất, rất, rất nhỏ để các bạn thấy rằng, việc đem những số liệu thô được cung cấp phổ biến trên mạng ra để so sánh là hàm chứa cái gì đó rất, rất vô lý. Chưa nói tới việc đặt chúng riêng lẻ.

Quay lại Townsend và Neymar. Kết hợp hai số liệu thô về số cú dứt điểm và số bàn thắng, chúng ta có được một loại số liệu đã qua xử lý: tỷ lệ chuyển hóa cú dứt điểm thành bàn thắng. Neymar đạt 22% (22% cú dứt điểm của Neymar trở thành bàn thắng), còn Townsend chỉ chưa đầy 2%.

À, như vậy là đâu lại vào đó. Một con số được xử lý đơn giản đã bắt đầu phản ánh được… sự thật.

Tottenham-vs-Arsenal-Capital-One-Cup

Rất có thể giờ thì bạn đặt ra câu hỏi là vì sao Townsend không ghi bàn được? Hay nói chính xác hơn, đâu là sự khác biệt giữa những cú dứt điểm của Neymar và Townsend? Liệu có thể giải thích một cách đơn thuần là kỹ năng Neymar tốt hơn, hay Neymar… may mắn hơn Townsend(!?).

Mô hình hóa những con số

Cũng với ngần ấy số lần dứt điểm của hai cầu thủ, hãy tư duy ở góc độ giàu hình ảnh hơn và đặt câu hỏi: vị trí của những cú dứt điểm ấy là ở đâu trên mặt sân?

Dưới đây là hai bản đồ thể hiện điều đó:

andy_neymar_shotmaps

Ảnh: MK Shot Locations – Ấn vào để xem kích cỡ đầy đủ.

Á à.

Okay. Nếu các bạn chưa đọc bài viết về “bàn thắng kỳ vọng (xG)”, hãy đọc ngay. Còn nếu đọc rồi, thì hẳn các bạn đều hiểu và đồng ý rằng, khoa học đã cho thấy các khu vực dứt điểm hiệu quả, dễ thành bàn thường là các cú dứt điểm ở gần khung thành.

Nếu vẽ ra một vòng tròn để chỉ những khu vực dứt điểm hiệu quả ấy ra trên sân, có lẽ người ta sẽ hiểu rằng Townsend toàn tung những cú sút trời ơi đất hỡi. Nếu vào thì nó là siêu phẩm, nếu ra ngoài thì là… rất bình thường.

Ngược lại, Neymar thường xuyên dứt điểm ở những vị trí gần gôn, hiệu quả cao là rất dễ hiểu.

Kết luận

Kể từ giờ, khi ai đó nói với bạn rằng, X là một cầu thủ giỏi vì anh ta thực hiện Y đường chuyền tạo cơ hội và Z cú đưt điểm, cộng thêm N pha qua người mỗi trận, hãy lùi lại một bước và đặt câu hỏi rằng, liệu như thế đã là đủ để đánh giá anh ta hay chưa.

Có ba bước để tư duy khi phân tích thống kê về một cầu thủ:

B1: Xác định những điều chúng ta muốn đánh giá về anh ta. Ví dụ cầu thủ tấn công là khả năng mang tới bàn thắng.

B2: Đặt các con số thô sang một bên và bắt đầu xử lý chúng để tìm ra mức độ hiệu quả thi đấu của cầu thủ.

B3: Bản đồ hóa, biểu đồ hóa các thống kê để có góc nhìn hình ảnh hơn, qua đó có thể đánh giá thấu đáo hơn về vấn đề.

BÌNH LUẬN

TÁC GIẢ
Dũng Lê
153 bài viết
“Cruyffian.”
Phát bóng lên ^