Thông báo workshop về phân tích dữ liệu

Tôi rất hân hạnh thông báo cùng các bạn xa gần là vào cuối tháng 12 này chúng tôi sẽ tổ chức một khoá học 2 tuần về phân tích dữ liệu dùng ngôn ngữ R tại Trường ĐH Tôn Đức Thắng. TS Trần Sơn Thạch, tôi, và vài giảng viên khác sẽ phụ trách hướng dẫn các học viên. Đây là một workshop khá dài ngày, nên chúng tôi chỉ tổ chức 1-2 lần mỗi năm.

Trong lớp học “Phương pháp nghiên cứu khoa học” dành cho khối khoa học xã hội vào dịp đầu năm, chúng tôi có một cuộc thăm dò ý kiến, mà kết quả là đại đa số học viên muốn học thêm về phương pháp phân tích dữ liệu. Ngoài ra, chúng tôi cũng đã có những thăm dò khác trong giới khoa học, và kết quả cũng cho thấy phân tích dữ liệu là một nhu cầu cấp thiết. Để đáp ứng nhu cầu đó, Trường đại học Tôn Đức Thắng hân hạnh tổ chức một khóa học ngắn hạn về phương pháp phân tích dữ liệu nghiên cứu khoa học.
Dự kiến khóa học sẽ kéo dài 12 ngày, từ 20/12/2015 đến 31/12/2015. Chương trình chia làm 2 phần: basic và advanced như sau: 
• Chương trình cơ bản từ ngày 20/12/2015 đến 25/12/2015.
• Chương trình nâng cao từ ngày 26/12/2015 đến 31/12/2015.
Mục tiêu chính của khóa học là trang bị cho các học viên những kiến thức cơ bản về các mô hình phổ biến trong phân tích dữ liệu, và kĩ năng ngôn ngữ R để thực hiện những mô hình phân tích. Khóa học sẽ tập trung vào cách lên kế hoạch phân tích, cách đặt câu hỏi nghiên cứu và suy nghĩ phân tích, cách thực hiện phân tích bằng R, và quan trọng hơn hết là diễn giải kết quả phân tích. Sau khi hoàn thành khóa học, chúng tôi kì vọng học viên sẽ có khả năng:
• Học cách tạo dữ liệu, biên tập dữ liệu dùng phần mềm R;
• Dùng các hàm R để thực hiện những phân tích mô tả bằng biểu đồ chất lượng cao;
• Hiểu về ý nghĩa của giả thuyết khoa học, kiểm định thống kê (test of significance), và diễn giải trị số P;
• Hiểu lí thuyết đằng sau so sánh giữa hai nhóm và nhiều hơn 2 nhóm (như t-test, chi-squared test, binomial test) và dùng R để thực hiện kiểm định;
• Hiểu lí thuyết tương quan, và các mô hình phân tích tương quan, hồi qui tuyến tính; dùng R ước tính tham số của mô hình; và diễn giải ý nghĩa của các tham số;
• Hiểu lí thuyết phân tích đa biến (multivariate analysis, như principal component analysis, cluster analysis) và dùng R để thực hiện phân tích đa biến.
• Hiểu những lí thuyết cơ bản đằng sau thí nghiệm, và dùng hàm R để ước tính cỡ mẫu.
Khóa học được thiết kế cho các nghiên cứu sinh và các nhà nghiên cứu có nhu cầu phân tích dữ liệu. Học viên không nhất thiết đã có chuyên môn về R hay thống kê học, nhưng có kiến thức cơ bản về thống kê học là một điểm mạnh. Các giảng viên muốn có kiến thức và kĩ năng về R cho các mô hình phân tích nâng cao cũng có thể tham gia chương trình nâng cao của khóa học.
Chương trình học: Sáng học về lí thuyết, chiều thực hành trên máy tính cá nhân.
20/12/2015. Chủ đề: Ôn bài về R 
• Bài 1: Cú pháp, input và output, môi trường vận hành
• Bài 2: Mã hoá dữ liệu
• Bài 3: Biên tập dữ liệu
21/12/2015. Chủ đề: Lí thuyết kiểm định giả thuyết 
• Bài 4: Kiểm định giả thuyết và trị số P.
• Bài 5: Mục tiêu và qui trình phân tích (Giới thiệu cách viết protocol phân tích)
• Bài 6: Cách tổ chức dữ liệu cho phân tích thống kê.
22/12/2015. Chủ đề: Phân tích mô tả 
• Bài 7: Giới thiệu cách phân tích mô tả bằng biểu đồ cơ bản
• Bài 8: Giới thiệu package tables
• Bài 9: Phân tích tần số
23/12/2015. Chủ đề: Phân tích mô tả các biến liên tục
• Bài 11: Giới thiệu package tables
• Bài 12: Phân tích mean và SD, SE (lí thuyết + thực hành)
• Bài 13: So sánh hai số trung bình: Kiểm định t
24/12/2015. Chủ đề: Phân tích biểu đồ
• Bài 15: Giới thiệu ggplot2
• Bài 16: Biểu đồ phân bố
• Bài 17: Biểu đồ hộp 
• Bài 18: Biểu đồ thanh
• Bài 19: Biểu đồ tương quan
25/12/2015. Chủ đề: Phân tích tương quan
• Bài 20: Phân tích tương quan
• Bài 21: Giới thiệu mô hình hồi qui tuyến tính
• Bài 22: Ước tính tham số và diễn giải
26/12/2015. Chủ đề: Mô hình hồi qui tuyến tính đa biến 
• Bài 24: Giới thiệu mô hình hồi qui tuyến tính đa biến
• Bài 25: Mô hình hồi qui đa biến với biến phân loại
27/12/2015. Chủ đề: Mô hình hồi qui tuyến tính đa biến 
• Bài 27: Ảnh hưởng tương tác trong hồi qui tuyến tính
• Bài 28: Vấn đề đa cộng tuyến trong hồi qui tuyến tính
28/12/2015. Chủ đề: Mô hình hồi qui logistic 
• Bài 30: Odds ratio và relative risk
• Bài 31: Giới thiệu mô hình hồi qui logistic
29/12/2015. Chủ đề: Mô hình hồi qui logistic
• Bài 36: Phương pháp tìm mô hình hồi qui logistic tối ưu
• Bài 37: Chiến lược xây dựng mô hình tiên lượng
30/12/2015 Chủ đề: Mô hình đa biến (multivariate models) 
• Bài 38: Giới thiệu và khái niệm mô hình đa biến
• Bài 39: Mô hình phân tích PCA
31/12/2015. Chủ đề: Mô hình đa biến (multivariate models)• Bài 40: Mô hình phân tích nhân tố (factor analysis)
• Bài 41: Mô hình phân tích cụm (cluster analysis)
• Bài 42: Phương pháp xử lí missing values
Học viên có thể đăng ký từ ngày ra thông báo đến hết ngày 01/12/2015.Lệ phí khóa học: 3 triệu đồng cho khóa học cơ bản, và 3 triệu đồng cho khóa học nâng cao. Nếu tham dự cả hai khóa học, học phí sẽ là 5 triệu đồng.
Mọi thông tin vui lòng liên hệ: Phòng Quản lý phát triển Khoa học và Công nghệ (ThS. Nguyễn Thị Mai Hương), Phòng A303, số 19 Đường Nguyễn Hữu Thọ, P. Tân Phong, Q.7, TP. HCM.
Điện thoại: (08) 37755 037; Email: nguyenthimaihuong1@tdt.edu.vn
Thông báo chính thức có trong đường link dưới đây:
http://www.tdt.edu.vn/images/_news/tintuc/thongbaochung/2015/thongbaokhoahoc.pdf