Tỉnh có tỉ lệ tốt nghiệp THPT đáng nghi ngờ nhất

https://i1.wp.com/mekong-tourism.com/wp-content/uploads/2011/07/an_giang.gif?resize=146%2C93Tiếp theo bài trước, bài này sẽ chỉ ra cụ thể tỉnh thành nào có tỉ lệ tốt nghiệp trung học phổ thông (THPT) năm 2011 đáng nghi ngờ nhất. Dùng một phương pháp đơn giản mô tả trong bài trước tôi nhận ra một sự thật đau lòng: các tỉnh trong vùng Đồng bằng sông Cửu Long có tỉ lệ đáng nghi ngờ nhất. Đứng đầu “bảng phong thần” này chính là An Giang!
Bây giờ chúng ta sẽ cố gắng trả lời băn khoăn của Phó thủ tướng Nguyễn Thiện Nhân về tỉnh thành có tỉ lệ tốt nghiệp tăng bất ngờ.  Tôi thì nghĩ đáng ngờ, hơn là bất ngờ.  “Đáng ngờ” ở đây có nghĩa là tỉ lệ tốt nghiệp năm 2011 có vẻ tăng hay giảm một cách bất bình thường. Vấn đề do đó là tìm ngưỡng thời gian để định nghĩa “bình thường”. Chúng ta biết rằng bệnh thành tích đã ăn sâu vào hệ thống giáo dục rất lâu, nên khó có thể nói năm nào là “sạch” hay bình thường được. Nhưng trong những năm bất bình thường, tôi thấy (qua quan sát dữ liệu về tỉ lệ tốt nghiệp THPT) năm 2006 đến 2009 là tương đối ổn định. Do đó, chúng ta sẽ so sánh tỉ lệ tốt nghiệp năm 2011 với tỉ lệ trung bình 2006-2009.
Về mặt phân tích, chúng ta có thể tiếp cận vấn đề một cách đơn giản như sau:
  • Ở mỗi địa phương, tính tỉ lệ tốt nghiệp “thật” (chỉ là ước tính thôi), và gọi đó là Ti như đề cập trong bài trước (chú ý ở đây có nghĩa là mã số cho từng tỉnh, i=1 đến 63); chỉ tính trong thời gian 2006 đến 2009 vì đây là thời gian tỉ lệ tương đối ổn định;
  • Ở mỗi địa phương, tính độ lệch chuẩn trong thời gian 2006 đến 2009, và gọi là Si như đề cập trên; Si chính là chỉ số phản ảnh độ dao động về điểm thi qua 4 năm;
  • Nhưng Si có thể tùy thuộc vào Ti, cho nên ở mỗi địa phương, chúng ta tính chỉ số Zi cho năm 2011: Zi = (tỉ lệ năm 2011 – Ti) / Si. Chỉ số không có đơn vị, và vì thế cho phép chúng ta so sánh giữa các tỉnh thành. Nếu Zbằng 0, thì điều đó có nghĩa là tỉnh thành đó có tỉ lệ tốt nghiệp năm 2011 bằng tỉ lệ trung trung bình 4 năm; nếu Z > 0, tỉ lệ năm 2011 cao hơn trung bình; và nếu Z < 0, tỉ lệ tốt nghiệp năm 2011 thấp hơn trung bình. Z càng cao, chúng ta càng có lí do để nghi ngờ tỉnh đó có vấn đề. Thật ra, có thể tính “xác suất nghi ngờ” bằng cách dựa vào luật phân bố chuẩn – normal distribution – nhưng có lẽ chưa cần làm phức tạp thêm vấn đề ở đây, nên chúng ta tạm thời dùng Z như là một thước đo. 
Dùng tỉ lệ tốt nghiệp 2006 đến 2011, tôi có kết quả như sau (Bảng 1). Có thể rút ra vài điểm chính trong bảng này như sau:
Thứ nhất, điều đáng chú ý đầu tiên là tất cả các tỉnh thành đều có Z trên 0. Nói cách khác, tỉ lệ tốt nghiệp THPT năm 2011 của tất cả các tỉnh thành đều cao hơn so với trung bình.
Thứ hai, An Giang là tỉnh đáng nghi ngờ nhất. Tỉ lệ tốt nghiệp THPT năm 2011 của An Giang là 98.3%, nhưng tỉ lệ trung bình 2006 – 2009 của tỉnh này chỉ 76.15 và độ lệch chuẩn là 3.54% (tức tương đối thấp). Do đó, chỉ số Z = (98.3 – 76.15) / 3.5 = 6.27. Nói cách khác, tỉ lệ tốt nghiệp năm 2011 của An Giang cao gấp 6.3 lần độ lệch chuẩn của chính tỉnh này!  Đó là một tỉ lệ rất đáng nghi ngờ.  Xác suất mà Z cao hơn 6 gần như là 0. Nghi ngờ dựa vào chính chuẩn của tỉnh An Giang!
Thứ ba, dùng cách phân tích trên, tôi nhận ra các tỉnh sau đây cũng đáng nghi ngờ nhất: Sóc Trăng, Quảng Bình, Kiên Giang, Bạc Liêu, Hậu Giang, Phú Yên, và Cà Mau. Các tỉnh này có chỉ số Z cao 2 hoặc trên 2. Chỉ có 6 tỉnh thành là có chỉ số Z thấp hơn 1.
Chúng ta có thể chia “mức độ nghi ngờ” thành 3 nhóm. Nhóm 1 (thấp nhất) nếu chỉ số Z thấp hơn 1; nhóm 2 có độ nghi ngờ trung bình nếu Z trong khoảng 1 và 2; và nghi ngờ cao nhất là những tỉnh thành có chỉ số Z cao hơn hoặc bằng 2. Với cách phân loại đó, chúng ta có thể xem các tỉnh / thành đáng nghi ngờ cho 3 miền như sau.
Số tỉnh thành phân chia theo mức độ nghi ngờ về tỉ lệ tốt nghiệp 2011
Miền
Độ nghi ngờ cấp 1
Độ nghi ngờ cấp 2
Độ nghi ngờ cấp 3
Bắc
9 (75.0)
16 (37.2)
0 (0.0)
Trung
2 (16.7)
13 (30.2)
2 (25.0)
Nam
1 (8.3)
14 (32.6)
6 (75.0)
Tổng cộng
12
43
8
Số trong ngoặc là tỉ lệ cho từng nhóm
Trong số 63 tỉnh thành, phần lớn có độ nghi ngờ cấp 2 (43 tỉnh thành, chiếm 68%) và cấp 3 (8 tỉnh thành, hay 13%). Trong nhóm 8 tỉnh thành có độ nghi cờ cấp 3, 75% là các tỉnh thành miền Nam, đặc biệt là vùng Đồng bằng sông Cửu Long (miền Tây). Tuy nhiên, trong nhóm có độ nghi ngờ cấp 2 thì phân bố khá đều giữa 3 vùng. Trong số 12 tỉnh thành có độ nghi ngờ cấp 1, phần lớn (75%) là các tỉnh phía Bắc.
Nói tóm lại, để trả lời câu hỏi của Phó thủ tướng Nguyễn Thiện Nhân là tỉnh thành nào có tỉ lệ tốt nghiệp THPT đáng nghi ngờ nhất, tôi xin trả lời: đó là An Giang. Ngoài An Giang ra, các tỉnh trong vùng Đồng bằng sông Cửu Long (và Quảng Bình) là những địa phương có tỉ lệ tốt nghiệp THPT năm 2011 đáng nghi ngờ nhất. Cần nói thêm rằng An Giang từng được xem là nơi học giỏi nhất nhì ở miền Tây (thua Tiền Giang), từng có đại học trước 1975, mà bây giờ thì …  :-).
Cũng cần nói thêm rằng những phân tích trên đây vẫn còn “thô”, vì chưa xem xét đến tỉ lệ từng trường qua nhiều năm. Nếu có số liệu từ Bộ Giáo dục và Đào tạo tôi có thể trả lời cụ thể trường nào đáng nghi ngờ nhất, và sẽ làm phân tích miễn phí cho Bộ.
NVT
Có thể xem thêm vài bài cũ:

===
Bảng 1. Tỉ lệ tốt nghiệp trung học phổ thông 2011 và chỉ số Z
Tỉnh / thành
Tỉ lệ tốt nghiệp năm 2011
Tỉ lệ trung bình 2006-2009
Độ lệch chuẩn 2006-2009
Chỉ số Z cho năm 2011
An Giang
98.30
76.15
3.54
6.27
Soc Trang
90.74
62.02
9.82
2.93
Quang Binh
99.29
76.26
7.94
2.90
Kien Giang
97.34
67.57
12.06
2.47
Bac Lieu
96.00
66.57
13.16
2.24
Hau Giang
97.94
70.36
13.14
2.10
Phu Yen
92.76
72.80
9.78
2.04
Ca Mau
93.16
75.21
9.03
1.99
Khanh Hoa
96.61
84.36
6.73
1.82
Ninh Thuan
91.85
75.23
9.38
1.77
Long An
90.70
84.88
3.30
1.76
Dien Bien
95.65
68.98
15.76
1.69
Can Tho
97.74
84.58
7.87
1.67
Son La
97.00
51.72
27.70
1.63
TPHCM
96.67
94.77
1.17
1.63
Dong Thap
94.60
75.10
12.13
1.61
Dong Nai
95.34
80.41
9.34
1.60
Thua Thien
97.00
77.52
12.36
1.58
Ba ria – Vung tau
97.21
79.52
11.51
1.54
Ha Tinh
99.14
82.75
10.92
1.50
Cao Bang
93.73
54.86
26.10
1.49
Binh Duong
90.70
72.85
12.04
1.48
Dak Lak
88.36
65.50
15.85
1.44
Lang Son
96.80
75.54
14.89
1.43
Tra Vinh
91.87
82.19
6.81
1.42
Ha Giang
94.11
63.23
23.36
1.32
Tay Ninh
88.70
79.40
7.18
1.30
Kon Tum
97.31
77.18
15.73
1.28
Quang Ngai
98.65
83.34
12.09
1.27
Vinh Long
86.58
79.26
5.84
1.25
Ninh Binh
99.87
82.90
13.55
1.25
Binh Phuoc
94.57
75.30
15.56
1.24
Yen Bai
98.91
62.24
29.68
1.24
Quang Nam
97.84
78.39
15.76
1.23
Gia Lai
88.33
70.84
14.25
1.23
Binh Dinh
96.84
84.37
10.19
1.22
Hai Duong
99.18
89.02
8.63
1.18
Quang Ninh
97.70
82.69
12.78
1.17
Bac Kan
88.70
53.91
29.91
1.16
Da Nang
97.20
86.69
9.06
1.16
Tien Giang
90.95
85.98
4.29
1.16
Lai Chau
92.00
70.62
18.50
1.16
Thanh Hoa
99.23
79.85
16.78
1.16
Vinh Phuc
96.10
87.10
7.97
1.13
Dak Nong
81.95
67.05
13.27
1.12
Binh Thuan
88.06
80.11
7.15
1.11
Bac Giang
99.37
82.14
15.68
1.10
Hoa Binh
97.04
66.96
27.78
1.08
Hung Yen
97.05
84.37
11.73
1.08
Ha Noi
97.79
85.06
11.81
1.08
Nghe An
97.83
72.71
23.64
1.06
Tuyen Quang
99.64
62.80
35.57
1.04
Ha Nam
99.69
92.31
7.15
1.03
Hai Phong
99.85
90.07
9.52
1.03
Phu Tho
99.21
77.65
21.18
1.02
Thai Binh
99.71
83.37
16.14
1.01
Bac Ninh
99.62
89.01
10.50
1.01
Nam Dinh
99.89
95.72
4.25
0.98
Quang Tri
94.74
72.44
23.10
0.97
Lam Dong
93.44
87.40
6.52
0.93
Ben Tre
84.15
82.30
3.20
0.58
Thai Nguyen
93.70
90.55
6.65
0.47
Lao Cai
82.00
76.33
16.84
0.34