Nhận thấy người mù còn chịu nhiều thiệt thòi, nhất là khả năng tiếp cận với các tin tức thời sự hàng ngày, một nhóm bạn trẻ thuộc Phòng thí nghiệm trí tuệ nhân tạo - AlLab (Trường Đại học Khoa học tự nhiên TPHCM) đã cho ra đời phần mềm xử lý giọng nói tiếng Việt có tên iNghe. Từ thành công bước đầu, những người trẻ này tiếp tục chạy đua với thời gian, kịp hoàn thành một dự án cộng đồng khác.
Tôi muốn nghe báo...
Với những người mù, muốn biết một tin tức thời sự nào đó chỉ có cách canh thời gian nghe trên đài phát thanh. Tuy nhiên giờ đây, chỉ với một thiết bị cầm tay như điện thoại, máy tính bảng chạy trên nền hệ điều hành Android hoặc iOS, người khiếm thị có thể lướt web nghe thông tin bất kỳ lúc nào. Chỉ cần nhấn vào nút “Home” và nói nội dung muốn nghe. Chẳng hạn, người dùng chỉ việc nói “Tôi muốn nghe báo…, chuyên mục thanh niên”, iNghe sẽ phát tin tức theo đúng yêu cầu người dùng. Ngoài ra, người dùng cũng có thể tùy chọn danh sách các báo hoặc chuyên mục yêu thích của mình.
Khả năng đặc biệt này chính là thành quả hơn 4 tháng miệt mài nghiên cứu của nhóm bạn trẻ Trần Minh Trường, Cao Xuân Nam, Phạm Minh Nhật, Nguyễn Ngọc Huệ, Phạm Ngọc Bách.
Theo nhóm bạn này, ý tưởng đến sau buổi gặp gỡ và trao đổi với đại diện Hội Người mù Việt Nam. “Chúng tôi thật bất ngờ khi biết được người mù chỉ có thể tiếp cận thông tin chủ yếu thông qua sách nổi. Và cũng không phải ai cũng có thời gian cập nhật tin tức qua ti vi và radio. Với thành quả về công nghệ xử lý tiếng nói mà nhóm đã dày công nghiên cứu trước đó, chúng tôi bắt tay vào hiện thực hóa ý tưởng về một phần mềm đọc báo cho người mù”, Trần Minh Trường, trưởng nhóm nghiên cứu nói.
Chỉ với 5 thành viên thay nhau hoàn thành công việc bên cạnh việc học tập, nên áp lực thời gian không hề nhỏ. Nhiều hôm, sau giờ học, cả nhóm lại lao vào việc cho đến nửa đêm mới chịu dừng tay. Sau 4 tháng vừa làm vừa chỉnh sửa, đến tháng 9, iNghe lần đầu tiên được đưa lên kho ứng dụng cho người dùng thử. Hiện tại, phần mềm iNghe có thể đọc được 9 tờ báo và 13 chuyên mục chỉ cần tương tác bằng giọng nói. “Thật vui khi chỉ một tháng sau đó, phần mềm đã có hơn 7.000 lượt tải. Vui hơn là chúng tôi nhận được nhiều lời cảm ơn từ những người mù trên khắp đất nước”, Phạm Minh Nhựt, thành viên nhóm nghiên cứu chia sẻ.
Và dự án đọc màn hình cho người mù
PGS-TS Vũ Hải Quân, Giám đốc Phòng thí nghiệm trí tuệ nhân tạo của Trường Khoa học tự nhiên, cho biết: “iNghe chỉ là ý tưởng nho nhỏ nhưng là bước đệm để các bạn thực hiện dự án lớn hơn. Chúng tôi đang kết hợp với Hội Người mù Việt Nam thực hiện dự án đọc màn hình vi tính cho người mù. Khi người sử dụng máy tính và rê chuột trên màn hình sẽ có một phần mềm xác định địa điểm con chuột và phát ra âm thanh. Dù không nhìn thấy màn hình cũng xác định và đưa con trỏ đến được vị trí mình cần”.
Tại Việt Nam hiện nay, các trung tâm người mù đa phần sử dụng 2 phần mềm chính để đọc màn hình là NVDA và JAWS. Đây là công nghệ do nước ngoài viết và không tích hợp tiếng Việt. Người mù gặp rất nhiều khó khăn khi tiếp cận với máy tính do không rành ngoại ngữ. Vì vậy, nhóm nghiên cứu tích hợp giọng đọc tiếng Việt vào 2 phần mềm kể trên.
Chia sẻ về định hướng phát triển, Minh Nhựt cho biết bước đầu thử nghiệm tại Trường mù Nguyễn Đình Chiểu (phía Nam) và Trung ương Hội Người mù Việt Nam (phía Bắc), nhóm nhận được nhiều lời khen. Nhóm cũng cố gắng hoàn thiện hơn trong thời gian qua như tích hợp giọng nói của người ở Hà Nội, Huế và TPHCM và giọng nói của người ở các vùng, miền khác. Do đây là dự án đặc biệt bởi ý nghĩa về mặt nhân văn.
BẢO TRÂN