Giáo sư Vũ Hà Văn: “Xác suất thống kê là nền tảng của khoa học dữ liệu”

“Chúng ta thường xuyên hỏi: Học toán để làm gì? Trong các chuyên ngành toán học, xác suất thống kê dạy cho ta cách tư duy đúng đắn và mạch lạc nhất trên dữ liệu hay hiện tượng quan sát được trong cuộc sống hàng ngày”. 

Đây là chia sẻ của Giáo sư Vũ Hà Văn (Giám đốc Khoa học – Viện Nghiên cứu Dữ liệu lớn VinBDI) sau khi ông vinh dự là một trong 35 nhà khoa học trên toàn thế giới được bầu chọn trở thành Hội viên danh dự (Fellow) của hiệp hội Toán thống kê (Institute of Mathematical Statistics-IMS) năm 2020. 

Bất ngờ khi được công nhận ở một lĩnh vực mới 

- Xin chúc mừng giáo sư được bầu chọn trở thành Hội viên danh dự của hiệp hội Toán thống kê năm 2020. Đây thực sự là một tin vui đối với cộng đồng khoa học của Việt Nam, đặc biệt là trong thời gian gần đây, khi vai trò của thống kê và xác suất trở nên vô cùng quan trọng với các ứng dụng về dữ liệu lớn, trí tuệ nhân tạo… Giáo sư có thể chia sẻ thêm về niềm vui này?

Đối với tôi, đây là một niềm vui lớn kèm cả sự bất ngờ. Theo lý lịch khoa học, tôi không phải là người được đào tạo bài bản về xác suất thống kê. Đề tài tiến sĩ của tôi nằm trong lĩnh vực toán tổ hợp. Trong nhiều năm sau khi tốt nghiệp, tôi tập trung nghiên cứu về lý thuyết đồ thị và số học tổ hợp. Sau đó tôi mới chuyển sang nghiên cứu một số đề tài khá cơ bản trong xác suất thống kê. 

Toán học hiện đại rất chuyên sâu, các nhà nghiên cứu ở chuyên ngành khác nhau (như đại số, số học, hay hình học) không hiểu công trình của nhau là chuyện bình thường. Vì vậy, việc được công nhận ở một lĩnh vực mới thực sự đem lại cho tôi niềm vui bất ngờ và một chút tự tin. Tôi không còn trẻ nữa nên bắt đầu cái gì mới cũng gian nan. 

Giáo sư Vũ Hà Văn: 'Xác suất thống kê là nền tảng của khoa học dữ liệu' ảnh 1 Giáo sư Vũ Hà Văn

- Vậy giáo sư có thể cho biết, cơ duyên nào khiến giáo sư tìm đến bộ môn xác suất thống kê?

Xác suất thống kê hấp dẫn tôi không chỉ bởi vẻ đẹp toán học mà vì ý nghĩa thực sự của nó trong cuộc sống. Xác suất thống kê là nền tảng của khoa học dữ liệu và có lẽ sẽ là một trong những môn học quan trọng nhất trong tương lai. Chúng ta thường xuyên hỏi: Học toán để làm gì? Trong các chuyên ngành toán học, xác suất thống kê dạy cho ta cách tư duy đúng đắn và mạch lạc nhất trên dữ liệu hay hiện tượng quan sát được trong cuộc sống hàng ngày.

Một trong những ngành khoa học có ứng dụng nhiều nhất 

- Giáo sư nhận định thế nào về thực trạng nghiên cứu và đào tạo về xác suất thống kê hiện nay tại Việt Nam? Và theo giáo sư xác suất thống kê sẽ có giá trị ứng dụng như thế nào trong tương lai?

Xác suất thống kê là nền tảng của khoa học dữ liệu. Tuy nhiên, có một thực tế là học sinh Việt Nam tuy học toán tốt nhưng ít người quan tâm đến thống kê. Tư duy thống kê trong trong nghiên cứu cũng chưa mạnh, cơ sở dữ liệu đáng tin cậy rất thiếu thốn. 

Thống kê là một trong những ngành khoa học có ứng dụng nhiều nhất hiện nay với vai trò lớn trong tất cả các nghiên cứu định lượng. Các ứng dụng, nhất là trong học máy, đem lại nhiều phát minh mới như các sản phẩm về AI. Thống kê trong nghiên cứu về gen giúp phát hiện những kiến thức mới về di truyền. Thống kê trong y học giúp phát hiện những liên quan bất ngờ giữa bệnh và thuốc. Hay thống kê trong kinh tế phát hiện những quy luật mới về tiêu dùng. Tư duy thống kê là thứ nên trang bị cho toàn xã hội, giúp cho từng cá nhân có cách đánh giá khoa học về các sự kiện diễn ra quanh mình. 

- Là người đứng đầu một Viện lớn (VinBDI) và được thành lập rất sớm trong khối công nghệ của Tập đoàn Vingroup, xin giáo sư cho biết, VinBDI sẽ làm gì để Việt Nam và thế giới nhìn nhận đúng vai trò của xác suất thống kê?

Hiện tôi cùng đồng nghiệp của mình tại Viện nghiên cứu Dữ liệu lớn (VinBDI) đang hợp tác với các đơn vị đào tạo hàng đầu Việt Nam như ĐH Bách Khoa Hà Nội hay Viện Toán học, phát triển các Chương trình đào tạo sau đại học cho các ngành liên quan đến lĩnh vực Khoa học dữ liệu. Chương trình được tài trợ bởi Quỹ Đổi mới sáng tạo VinIF (trực thuộc viện VinBDI). Sinh viên, nghiên cứu sinh được nhận học bổng và có thể tham gia trực tiếp vào một số đề tài đang được viện triển khai. 

Bên cạnh đó, chúng tôi triển khai nhiều dự án xây dựng và ứng dụng các cơ sở dữ liệu lớn với mục đích phục vụ xã hội. Chẳng hạn dự án ứng dụng Trí tuệ nhân tạo trong chẩn đoán bệnh qua hình ảnh sắp ra mắt, hướng tới mục tiêu giúp các bác sĩ có thể chuẩn đoán bệnh nhanh và chính xác hơn một cách đáng kể. 

Chúng tôi cũng đã xây dựng cơ sở dữ liệu gen của người Việt. Đây sẽ là hệ thống cơ sở dữ liệu gen lớn nhất ở Việt Nam. Một số dự án y học, nghiên cứu một số bệnh thường gặp cũng đang được xây dựng song song trên cơ sở dữ liệu này. Một số dự án về AI đã bắt đầu hình thành các sản phẩm thông minh có thể ứng dụng rộng rãi trên điện thoại hay hệ thống tín dụng, ví dụ như sửa lỗi chính tả tự động hay nhận dạng tiếng nói. Chúng tôi muốn thay đổi quan điểm về tư duy đào tạo của bộ môn xác suất thống kê tại Việt Nam, đồng thời phát triển các ứng dụng xác suất thống kê đưa vào cuộc sống.

Cảm ơn và kính chúc giáo sư sức khỏe, ngày càng có thêm nhiều thành công trong hoạt động nghiên cứu và phát triển nền khoa học nước nhà!

IMS được thành lập tại Mỹ năm 1935. Hàng năm hội vinh danh hội viên danh dự, là những cá nhân có thành tích xuất sắc trong nghiên cứu hoặc có ảnh hưởng tích cực đối với sự phát triển và lan tỏa những giá trị của thống kê.

Trong lịch sử 85 năm của mình, IMS đã vinh danh gần 1.300 hội viên danh dự đến từ rất nhiều lĩnh vực khác nhau như kinh tế, điện tử, y sinh học, dược học, cho đến lý thuyết học máy, hay toán học. Trong số những nhà khoa học được IMS vinh danh, có 5 nhà khoa học được giải Nobel về kinh tế, hàng trăm thành viên các viện hàn lâm của nhiều nước trên thế giới. John von Neumann, một trong những nhà khoa học xuất sắc nhất thế kỷ XX, cũng là một trong những thành viên danh dự sớm nhất của hiệp hội.

Các tin, bài viết khác

Đọc nhiều nhất

Một góc Công viên phần mềm Quang Trung

Sớm gia hạn thí điểm Chuỗi QTSC

Các thành viên của Chuỗi Công viên phần mềm Quang Trung gồm Công viên phần mềm Quang Trung (QTSC), ITP (Khu Công nghệ phần mềm Đại học Quốc gia TPHCM) và Trung tâm CNTT tỉnh Thừa Thiên - Huế (HueCIT) vừa tổng kết hoạt động của các thành viên chuỗi trong quý 1-2021 tại tỉnh Thừa Thiên - Huế.

Sản phẩm công nghệ

Snapdragon 720G trên realme 8 Pro có vượt trội?

realme 8 Pro thể hiện sức mạnh khi được trang bị Chip xử lý Qualcomm® Snapdragon ™. Snapdragon 720G với CPU và GPU tân tiến, tăng cường khả năng xử lý hình ảnh và tính toán dữ liệu cấp cao. Chip xử lý này không chỉ đảm bảo thiết bị được vận hành mượt mà mà còn xử lý dễ dàng các trò chơi đòi hỏi thông số cao…

Câu chuyện công nghệ

Những tên tuổi lớn thúc đẩy cuộc thi Solve For Tomorrow

Để tạo nên một sân chơi chơi dành cho lứa tuổi 12 – 18 nhằm khuyến khích khả năng sáng tạo, ứng dụng công nghệ vào trong thực tiễn, không chỉ mở rộng đối tượng tham dự ra nhiều tỉnh thành hơn mà còn hướng đến trẻ em vùng sâu vùng xa là Solve for Tomorrow 2021…, đòi hỏi ban tổ chức phải là những tên tuổi lớn, đảm bảo sự vận hành trơn tru cho cả một cuộc thi quy mô, kéo dài.

Thị trường - chính sách