Cảm tính hoá con số

Hôm nọ, nhóm chúng tôi có một cuộc tranh luận nho nhỏ về cách diễn tả một con số. Một chuyên gia truyền thông viết rằng “In Australia a bone is broken due to poor bone health every 3.4 minutes” (Ở Úc, cứ mỗi 3.4 phút thì có một người bị gãy xương). Phe khoa học thì phản đối cách diễn tả đó, vì họ cho rằng nó … buồn cười và trẻ con. Phe truyền thông thì nói cách diễn tả đó bình thường, và họ nói chẳng có gì sai cả. Tôi thì có cảm tình với phe khoa học, dù biết rằng họ không chỉ ra được cái sai trong cách phát biểu đó, nên họ chỉ nói … trẻ con. Đây là một cách nói rất phổ biến, nhưng cũng là một vấn đề hơi tinh vi về mặt thống kê.

Thật ra, đứng trên mặt tính toán số học thì chẳng có gì sai. Mỗi năm cả nước Úc ghi nhận khoảng 154000 ca gãy xương (tức là những người nhập viện vì gãy xương). Nhưng có lẽ con số đó hơi lớn, và nói ra thì chẳng ai quan tâm, nên người ta có cách nói sao cho gần gũi (ngắn) hơn là diễn tả trên phút. Tính ra thì cứ 3.4 phút có một người bị gãy xương. Đó là lí giải của phe truyền thông, và họ đúng khi nói rằng chẳng có gì sai về tính toán cả.
Không có gì sai về tính toán, nhưng có vấn đề về thống kê. Cách nói cứ mỗi 3.4 phút có 1 ca gãy xương hàm ý giả định rằng số ca gãy xương xảy ra một cách đồng đều — uniform, nhưng giả định đó sai. Sai là vì trong quần thể số ca gãy xương tuân theo luật phân bố Poisson, chứ không phải uniform. Do đó, cách nói đó tuy nghe qua có vẻ ấn tượng, nhưng thật ra là một ngụy biện. Nguỵ biện cấp thấp.
Cách nói 3.4 phút có 1 ca gãy xương còn là một kiểu nói cảm tính. Cảm tính là vì người nói muốn gây ấn tượng mạnh. Nói theo tiếng Anh, đó là kiểu nói manipulative framing of the number hay hiểu nôm na là vặn vẹo con số. Tức là người nói dùng nó để cảm tính hoá vấn đề. Cảm tính hoá dĩ nhiên là điều không nên trong khoa học. Đó chính là lí do tại sao phe khoa học cảm thấy “sai”, nhưng họ không nghĩ ra sai chỗ nào!
Nói tóm lại, đối với người làm khoa học, cần nên tránh cách nói theo kiểu “3.4 phút có 1 ca gãy xương” (hay tương tự), vì nó vừa cảm tính hoá vấn đề, mà lại vừa sai về mặt thống kê. Người không am hiểu thống kê nói thế thì có thể bỏ qua (vì họ ignorant) nhưng người biết chút ít về thống kê hay chút đỉnh về khoa học thì không nên nói như thế.