Khám phá trong nghiên cứu khoa học xã hội qua các phương pháp định lượng

http://stepsandleaps.files.wordpress.com/2011/06/wordle-general-survey.jpg?resize=170%2C98Năm ngoái tôi có dịp nói chuyện ở Viện Phát triển bền vững vùng Nam bộ (thực ra, đây là phân viện khoa học xã hội ở phía Nam), và có dịp tiếp xúc với những nghiên cứu của Viện và Viện Khoa học Xã hội. Một điểm chung của các nghiên cứu này là sự trống vắng của phương pháp định lượng (quantitative methods). Do đó, khi được mời nói chuyện trong Hội thảo Khoa học Xã hội thời Hội nhập (15/12/2011) tôi sẽ nói về khám phá trong khoa học xã hội qua phương pháp định lượng. Dưới đây là bản abstract (tóm tắt) của bài nói chuyện của tôi trong Hội thảo.

Trong Hội thảo này, có lẽ tôi là một người đơn độc. Nhìn vào chương trình hội thảo thấy rất nhiều bài nói chuyện định tính hơn là định lượng, và hình như tập trung vào những vấn đề mang tính chung chung hơn là những nghiên cứu cụ thể. Không thấy những nghiên cứu đáp ứng các vấn đề cấp thiết xã hội đang đặt ra. Nhưng có lẽ điều này cũng dễ hiểu vì chủ đề của Hội thảo là “hội nhập” quốc tế. Tôi nghĩ một cách hội nhập quốc tế hay nhất là nghiên cứu khoa học. Và, nghiên cứu phải đúng phương pháp và chuẩn mực quốc tế. Do đó, trong bài nói chuyện tôi sẽ cố gắng hết mình để thuyết phục rằng cần phải nâng cao tính định lượng trong nghiên cứu khoa học xã hội. Dù một bài nói chuyện như thế có thể đơn độc trong Hội thảo, nhưng như thế hoá ra lại có cái tốt của sự đơn độc.

Trên thế giới có hàng trăm tập san khoa học xã hội và bàng bạt trong những tập san này là phương pháp định lượng. Thử xem qua những tập san như American Journal of Sociology, American Socilogical Review, Journal of Asian Studies, Annual Review of Sociology, Human Ecology, Social Research, American Journal of Political Science, Psychometrika, Educational Measurements, v.v. chúng ta dễ dàng thấy rất nhiều những công trình nghiên cứu định lượng. Ngược lại, các tập san KHXH Việt Nam thì gần như chẳng có nghiên cứu định lượng nào. Hoặc khi có thì phương pháp quá đơn giản hoặc chưa đúng chuẩn mực. Do đó, tôi nghĩ nhu cầu của phương pháp định lượng trong nghiên cứu KHXH ở nước ta rất lớn. Bài nói chuyện dưới đây sẽ cố gắng thuyết phục giới nghiên cứu KHXN ở Việt Nam nên chú ý đến các phương pháp định lượng mà tôi sẽ giới thiệu trong một workshop 5 ngày sau Hội thảo. Những phương pháp định lượnhg sẽ giúp cho giới nghiên cứu KHXH khám phá nhiều mối liên hệ thú vị. 
NVT
===
Khám phá trong nghiên cứu khoa học xã hội qua các phương pháp định lượng
Hai chữ khoa học trong khoa học xã hội có thể hiểu bằng nhiều nghĩa khác nhau, nhưng ở đây tôi muốn nói đến những khám phá tri thức mới có độ tin cậy và chính xác cao. Cách hiểu khoa học này thật ra xuất phát từ khoa học tự nhiên, nhưng cũng có thể áp dụng cho khoa học xã hội. Trong bài này, tôi sẽ bàn về việc ứng dụng khoa học thống kê (statistical science, chứ không phải đơn thuần thống kê học – statistics) như là một phương tiện để khám phá tri thức mới cho các nhà khoa học xã hội. 
Các dữ liệu từ nghiên cứu khoa học xã hội thường rất phức tạp, vì mang tính đa biến và đa chiều. Khám phá những cơ cấu và mối liên hệ giữa các yếu tố trong một nghiên cứu là một thách thức lớn cho các nhà khoa học xã hội. Tuy nhiên, những phát triển trong khoa học thống kê đã giúp cho việc khám phá dễ dàng hơn. Ứng dụng của khoa học thống kê trong khoa học xã hội có thể chia thành hai nhóm: thiết kế nghiên cứu và suy luận khoa học. Bất cứ công trình nghiên cứu nào cũng khởi đầu từ khâu thiết kế, và khoa học thống kê đóng góp vào việc (a) chọn mô hình nghiên cứu thích hợp và tối ưu cho câu hỏi nghiên cứu; (b) ước lượng cỡ mẫu cần thiết cho mô hình nghiên cứu; cách lấy mẫu sao cho đảm bảo tính đại diện một quần thể.
Phân tích dữ liệu trong khoa học xã hội có thể chia thành hai nhóm chính: mô tả và suy luận. Mỗi nhóm phân tích đều có sự đóng góp của khoa học thống kê. Đối với phân tích mô tả, các phương pháp “cổ điển” như kiểm định Ki bình phương (Chi-squared test), kiểm định t, kiểm định z có thể ứng dụng để đáp ứng những câu hỏi nghiên cứu đơn giản. Rất nhiều phương pháp phân tích suy luận (inferential statistics) có thể ứng dụng cho các nghiên cứu khoa học xã hội. Các phương pháp định lượng mang tính suy luận bao gồm các mô hình phân tích hai biến (bivariate analysis) và đa biến (multivariate analysis) là những phương pháp quan trọng hỗ trợ cho nhà nghiên cứu trong việc thẩm định những mối tương quan phức tạp trong khoa học xã hội. Những phương pháp phân tích đa biến như phân tích yếu tố (factor analysis) và phân tích cụm (cluster analysis) còn giúp cho nhà nghiên cứu giảm độ phức tạp của cơ cấu dữ liệu, và dẫn đến những khám phá mà các phương pháp phân tích đơn giản không thể nào phát hiện được. Những mô hình như hồi qui tuyến tính, hồi qui logistic, hồi qui Poisson, hồi qui Cox cung cấp những phương tiện định lượng rất quan trọng trong việc khám phá các yếu tố có ảnh hưởng đến một sự cố hay hiện tượng xã hội.
Trong vài năm gần đây, khoa học thống kê đã có những phát triển ngoạn mục, và những phát triển này cung cấp cho khoa học xã hội những phương pháp định lượng để có những khám phá mới. Những phát triển mới trong mô hình tuyến tính cho phép nhà nghiên cứu phân tích những dữ liệu thu thập theo thời gian (longitudinal research). Với sự phát triển của máy tính, các nhà nghiên cứu khoa học xã hội đã có thể tiếp cận các phương pháp phân tích “hiện đại” như bootstrap và mô phỏng MCMC (Markov Chain Monte Carlo) mà trước đây chỉ dành cho các nhà khoa học thống kê chuyên nghiệp. Phương pháp MCMC cũng giúp cho các nhà khoa học xã hội có thể phân tích dữ liệu theo trường phái Bayes (Bayesian approach). Các phương pháp Bayes càng ngày càng trở nên hấp dẫn và quan trọng trong khoa học xã hội, vì các phương pháp này cho phép nhà nghiên cứu phát biểu về độ tin cậy của một giả thuyết khoa học dựa trên dữ liệu quan sát (thay vì phương pháp cổ điển chỉ cho phép nhà nghiên cứu phát biểu về dữ liệu quan sát trên cơ sở giả thuyết khoa học).
Ở nước ta, có một nghịch lí đáng chú ý: các nghiên cứu về khoa học xã hội hiện diện trên các tạp chí trong nước rất nhiều, nhưng lại xuất hiện rất ít trên các tạp chí khoa học quốc tế. Số liệu thống kê năm 2004 cho thấy trong số 8408 bài báo khoa học trong các tạp chí và kỉ yếu khoa học, có đến 4345 (hay 53%) là những bài báo liên quan đến khoa học xã hội. Tuy nhiên, trong năm 2004, con số bài báo khoa học xã hội trên các tạp chí khoa học quốc tế chưa quá con số 10 bài. Ngoài ra, phân tích của chúng tôi cho thấy trong thời gian 1996 – 2005, trong tổng số 3456 bài báo khoa học từ Việt Nam trên các tạp chí quốc tế, chỉ có 69 bài (tức khoảng 2%) liên quan đến ngành khoa học xã hội. Do đó, tuy số lượng nghiên cứu khoa học xã hội ở nước ta cao hơn so với các ngành khoa học tự nhiên, nhưng đại đa số những nghiên cứu đó chỉ xuất hiện trên các tạp chí trong nước, và rất ít xuất hiện trên các tạp chí quốc tế.
Một trong những “nguyên nhân” cho sự hiện diện khiêm tốn của khoa học xã hội Việt Nam trên trường quốc tế là vấn đề phương pháp định lượng. Có thể nói rằng phần lớn những nghiên cứu khoa học xã hội ở Việt Nam chưa tận dụng những phương pháp khoa học (scientific method) và phương pháp thống kê trong việc thiết kế nghiên cứu, phân tích dữ liệu, và diễn giải dữ liệu. Một số nghiên cứu có sử dụng phương pháp thống kê, nhưng chưa hẳn có hệ thống và chưa thích hợp. Nhiều sai sót hiển nhiên về cách lấy mẫu, phân tích và suy luận từ dữ liệu có thể tìm thấy trong rất nhiều bài báo trong ngành khoa học xã hội. Những thiếu sót về phương pháp dẫn đến chất lượng nghiên cứu chưa được cao, và hệ quả là nhiều công trình khó có cơ hội để được công bố trên các tạp chí khoa học xã hội quốc tế.
Ở các nước tiên tiến, khoa học thống kê (statistical science) đóng một vai trò rất quan trọng trong việc phát triển khoa học xã hội. Từ năm 1965, báo cáo Hội đồng Nghiên cứu Khoa học Xã hội ở Anh (Social Science Research Council) nhấn mạnh rằng nếu không có thống kê học và toán học, thì khoa học xã hội không thể nào phát triển được. Do đó, khoa học xã hội ở nước ta cần đến khoa học thống kê để phát triển. Khoa học thống kê có thể giúp cho các nhà khoa học xã hội phân tích mô tả và phân tích suy luận, và dẫn đến những khám phá có ý nghĩa thực tế và giúp cho việc hoạch định các chính sách công hữu hiệu hơn. Trong y khoa có học thuyết y học thực chứng (evidence based medicine) mà theo đó thực hành y khoa phải dựa vào bằng chứng khoa học.  Trong lĩnh vực xã hội, khái niệm chính sách công thực chứng (evidence based public policy) vốn đã hình thành gần đây, với nguyên lí các chính sách nên dựa vào bằng chứng khoa học.  Bằng chứng khoa học đáng tin cậy nhất phải đúc kết từ nghiên cứu khoa học mang tính định lượng.  Do đó, nghiên cứu khoa học xã hội bằng phương pháp định lượng sẽ giúp ích trong việc định hình những chính sách công thực chứng ở nước ta.