Sách về phân tích dữ liệu với R

Xin thông báo cùng các bạn đọc quan tâm rằng tôi sắp in cuốn sách về phân tích dữ liệu với ngôn ngữ R. Đây là một trong những cuốn sách tâm đắc nhất của tôi. Sau một thời gian trên dưới 10 năm đi giảng trong các workshop từ Nam chí Bắc về phương pháp phân tích dữ liệu, tôi nhận ra rằng VN cần một cuốn sách loại này. Thế là tôi bắt tay vào soạn, và hôm nay đã gửi cho nhà xuất bản in. Hi vọng sẽ phát hành vào tháng 10 năm nay. Bạn đọc nhớ ủng hộ nhé. 🙂

Hôm qua, nhận được email của một độc giả có tên giống ca sĩ (HN) làm tôi cảm động. Thư em viết:

Em là một học sinh online về thống kê trên youtube qua các bài giảng của thầy (em học thống kê để làm luận văn cho khóa học Master về môi trường tại [Âu châu]). Qua blog thầy em được biết là thầy đang dưỡng bệnh. Em chúc thầy mau hồi phục và luôn có một sức khỏe tốt.


Em rất muốn cảm ơn thầy vì những bài giảng thống kê trên Youtube. Ở đây [Âu châu] em có được học về thống kê và phần mềm R. Tuy nhiên vì không hiểu các kiến thức toán phức tạp nên em có gặp khó khăn trong việc hiểu để áp dụng R trong xử lý số liệu. Sau khi xem bài giảng của thầy, những kiến thức phức tạp được giải thích dễ hiểu và em cảm thấy chúng make sense hơn rất nhiều.”
Đúng là thế giới mạng tuy ảo mà gần gũi quá đi chứ. Thỉnh thoảng tôi nhận vài lá thư như thế này, và lần nào cũng làm tôi thấy mình như được khuyến khích. Phần lớn thư từ các em du học sinh nói rằng khi họ sang đây họ bỡ ngỡ với môn biostatistics (chắc như tôi hồi xưa) nhưng đọc sách tiếng Anh thì khó hiểu, còn sách VN thì không có, nên google thì gặp những bài giảng của tôi. Họ nói những bài đó như cái phao, giúp cho họ rất nhiều vì tôi giải thích đơn giản và dễ hiểu, làm cho họ có lợi thế ngay so với các sinh viên khác. Cái này thì chắc một phần là khen nịnh, một phần là khuyến khích vậy mà. Nhưng một số bạn sau này về nước có mời tôi đến trường giảng vài workshop. Nói là thế giới mạng nhưng cũng là thế giới thật.
Đi đâu, bất cứ trường nào, ai cũng nói đã đọc bài giảng và bài viết của tôi trên mạng. Đọc bài giảng thì tôi thấy sung sướng. Còn nghe nói đọc bài viết làm tôi … hoang mang, không biết người đối diện nghĩ gì về những ý kiến ý cò của mình. Có thể mất công tranh luận. Nói cho ngay, nhiều người rất ủng hộ ý kiến của tôi, và họ nói tôi là người nói cho họ. Cũng có người không cùng quan điểm, nhưng ai cũng lịch sự với tôi, và những lúc như thế thường kéo nhau ra … quán nhậu. Có lần kéo nhau qua quán và bên bàn kia, gặp một anh tóc bạc, là cựu sếp tuyên giáo của TP, anh ta gặp tôi và nói ngay: tôi đã đọc sách của anh và những bài viết của anh, hay lắm, nhưng có vài chỗ cần bàn thêm. Thế thôi. (Sau này chúng tôi gặp thêm mấy lần nữa và khi nào có sách mới tôi đều kí tặng). Thế giới mạng hay ở chỗ đó, vì nó giúp cho chúng ta gần gũi hơn.
Mấy bài giảng trên youtube chỉ là “tay trái” nhưng tôi không ngờ nó phổ biến đến như thế. Hôm nay lên youtube xem lại “dung nhan” mình thì thấy có bài được xem đến 14000 lượt. (Có bài nhạc favorite của một ca sĩ favorite của tôi uploaded mà chỉ có 400 người xem, buồn!) Trước đây, chúng tôi đã có dự định làm video, nhưng vì vấn đề kĩ thuật quay phim hơi nhiêu khê nên đành quên. Bẵng đi một thời gian, tôi nghĩ đến ứng dụng của cái MacBook và qua một em đâu đó bên VN hướng dẫn, tôi học được cách thu âm và thu hình powerpoint. Thế là tôi bắt tay vào làm series này. Thoạt đầu tôi chỉ muốn thử nghiệm, chứ chưa nghĩ đến cái gì xa xôi, nhưng khi được nhiều bạn khuyến khích nên tôi làm một loạt 32 bài. Rồi công việc chồng chất, rồi bệnh tật, nên series bị gián đoạn một thời gian. Mai mốt sẽ quay lại.
Tuy nhiên, tôi muốn báo một tin trước là trong thời gian nằm nhà tôi đã hoàn tất cuốn sách về R. Cuốn này xuất bản lần đầu năm 2006, nhưng chỉ in có 800 bản, nên bán vài tháng là hết. Nhà xuất bản của nhà nước thời đó [có nhiều điều để nói] nên họ làm ăn lề mề, không chịu in nữa. Họ chờ tôi cái gì đó, nhưng tôi tỏ ra cho họ biết tôi bất cần. Mấy năm sau này thì sách được in tùm lum (chắc là in lậu) và phát tán khắp nơi. Lần tái bản này cuốn sách được làm mới hoàn toàn, nên cũng phải lấy tựa đề mới. Tôi thêm những chương như phân tích biểu đồ với ggplot2, phương pháp bootstrap, phương pháp Bayes, Winbugs, Mixed-effects model, phân tích số liệu dãy thời gian (time series analysis), ước tính cỡ mẫu, v.v. Điều này có nghĩa sách có nhiều trang hơn (có thể lên đến 500 trang) và giá bán chắc mắc hơn trước đây, nhưng cái này do nhà xuất bản định đoạt. Bản thảo đã gửi cho nhà xuất bản, hi vọng sẽ in vào tháng 10/2014. Khi nào in xong, tôi sẽ thông báo để các bạn biết.