Thiết bị đọc báo cho người mù

“Tôi muốn nghe tin tức trên báo sggp.org.vn”, “Tôi muốn nghe phần tin tức xã hội”, “Dừng nghe, tôi muốn chuyển sang tin tức thể thao”… Chỉ với những câu lệnh đơn giản như vậy, bất kỳ người khuyết tật nào cũng dễ dàng truy cập vào kho sách nói đồ sộ với muôn vạn thông tin, thông qua một thiết bị cầm tay nhận dạng tiếng nói.
Thiết bị đọc báo cho người mù

“Tôi muốn nghe tin tức trên báo sggp.org.vn”, “Tôi muốn nghe phần tin tức xã hội”, “Dừng nghe, tôi muốn chuyển sang tin tức thể thao”… Chỉ với những câu lệnh đơn giản như vậy, bất kỳ người khuyết tật nào cũng dễ dàng truy cập vào kho sách nói đồ sộ với muôn vạn thông tin, thông qua một thiết bị cầm tay nhận dạng tiếng nói.

“Cha đẻ” của thiết bị là PGS-TS Hoàng Trang, Phó Trưởng khoa Điện - Điện tử, cùng các nhà khoa học tại Trường Đại học Bách Khoa - ĐHQG TPHCM. Đây cũng là sản phẩm từ đề tài cấp Nhà nước vừa được Bộ Khoa học - Công nghệ nghiệm thu.

PGS-TS Hoàng Trang, Trưởng nhóm nghiên cứu đang test tính năng chíp iHearTech

Công nghệ vượt trội

Thiết bị mà PGS-TS Hoàng Trang giới thiệu nhỏ gọn, tương đương một chiếc điện thoại di động cỡ 5 inch, bên trong chứa bo mạch với nhiều linh kiện điện tử. Trái tim của thiết bị là con chíp “iHearTech”, giúp nhận dạng và xử lý tiếng nói (tiếng Việt). Chỉ riêng thời gian nghiên cứu con chíp này đã chiếm trọn 3/4 thời gian dành cho nghiên cứu đề tài. Qua thẩm định thực tế, chíp iHearTech hỗ trợ bộ từ phụ thuộc người nói tối đa đến 768 từ, hỗ trợ bộ từ độc lập người nói tối đa 256 từ (giọng của bất kỳ ai nói máy đều nhận dạng). Với số lượng từ đó, khi người nói phối từ với nhau sẽ ra nhiều câu có nghĩa. Để máy dễ dàng tiếp nhận, nhóm nghiên cứu đã xây dựng bộ xử lý văn phạm, trong đó gom gọn các câu lệnh bằng những “key word”, giúp thời gian nhận dạng và xử lý câu lệnh nhanh hơn. Đó cũng là công nghệ quan trọng được chính nhóm nghiên cứu tự phát triển. Nếu so với các loại chíp tương tự đang có mặt trên thị trường thì iHearTech có nhiều chỉ số vượt trội cả về số lượng từ nhận dạng lẫn thời gian xử lý, xác suất nhận dạng chính xác, tần số hoạt động của chíp…

Theo nhóm nghiên cứu, công dụng chính của thiết bị là tiếp nhận lệnh bằng giọng nói và điều khiển theo lệnh. Nói nôm na rằng, khi người khiếm thị ra lệnh cho thiết bị truy cập vào một tờ báo điện tử nào đó, thiết bị sẽ có bộ phận lọc bỏ các dữ liệu không cần thiết khác, chỉ giữ lại phần chữ, sau đó chuyển định dạng chữ sang định dạng âm thanh và phát ra cho người nghe. Ngoài đọc báo online, thiết bị có bộ nhớ để lưu các tài liệu sách nói để khi không có internet, người khiếm thị có thể nghe offline ở bất kỳ đâu, bất kỳ lúc nào họ muốn.

Trong suốt hai năm nghiên cứu, không phải mọi thứ đều suôn sẻ. Từng có thời điểm tất cả các thành viên của nhóm nghiên cứu mất ăn, mất ngủ vì thiết bị không thể nhận dạng chính xác giọng nói. Làm xong mang đi thử, không đạt lại phải mày mò tìm nguyên nhân. Mỗi lần thất bại, không chỉ kinh phí nghiên cứu hao hụt dần mà tiến độ thời gian thực hiện cũng gây thêm áp lực cho nhóm. “Thiết bị càng nhỏ gọn, đòi hỏi công đoạn thiết kế và gia công phải kỹ. Con chíp sản xuất theo công nghệ 130nm, với những sợi đồng li ti, bất kỳ sai sót nào cũng khiến cho thiết bị không hoạt động như ý muốn”, PGS-TS Hoàng Trang kể lại.

Nhân rộng đối tượng sử dụng

Đến nay, thiết bị cầm tay nhận dạng tiếng nói của nhóm iHearTech đã được thử nghiệm tại 2 công ty và cũng đã có 2 lời đề nghị chuyển giao công nghệ, ứng dụng sản phẩm. Nhưng theo nhóm nghiên cứu, mong ước sau thành công của đề tài là có những đơn vị chung tay sản xuất ra các thiết bị hỗ trợ miễn phí cho người khiếm thị Việt Nam.

Bởi theo thống kê của các tổ chức xã hội công bố mà nhóm nghiên cứu đã ghi nhận lại được rằng, Việt Nam hiện có hơn 1 triệu người mù trong tổng số hơn 3 triệu người khiếm thị tại Việt Nam; có đến 82% người khiếm thị phản hồi rằng “đọc” là một phần rất quan trọng trong cuộc sống của họ, nhưng chỉ có 1% người khiếm thị có khả năng đọc được bằng chữ nổi. Trong khi đó, dù kho tàng sách hiện đồ sộ, nhưng trên thế giới chỉ khoảng 2% các tài liệu được chuyển sang các định dạng cho người khiếm thị. Tỷ lệ đó ở Việt Nam còn thấp hơn nhiều. Trong nghiên cứu của mình, nhóm iHearTech đã tiến hành khảo sát hàng trăm người khiếm thị trên địa bàn TPHCM và kết quả rằng đọc sách là khát khao cháy bỏng của người khiếm thị, trong đó nhiều nhất là sách giáo khoa phổ thông, sách học ngoại ngữ, sách văn học, sách các ngành nghề thủ công… Các nội dung này có rất ít ở dạng chữ nổi cho người mù.

  “Kế hoạch 5 năm phát triển ứng dụng ban đầu của chúng tôi đã trình lên Sở Khoa học - Công nghệ, đề tài này là bước nghiên cứu cuối và đưa thành ứng dụng, mang tính nhân văn, nghĩa tình; giúp các đầu tư nghiên cứu trước đó của Nhà nước cho chúng tôi không bị lãng phí. Sau khi đề tài thử nghiệm thành công, mong ước của nhóm sẽ thành lập doanh nghiệp phi lợi nhuận: kêu gọi, nhận sự đóng góp của xã hội để sản xuất sản phẩm với số lượng nhiều và đưa đến tay người khiếm thị”.

PGS-TS HOÀNG TRANG, Trưởng nhóm nghiên cứu
 



Để hỗ trợ người khiếm thị tiếp cận với thông tin, không ít các hãng công nghệ lớn đã ra đời ứng dụng nhận dạng và tổng hợp tiếng nói như Dragon của LH, Viavoice, Google voice search, Siri của Apple… nhưng khó khăn là các ứng dụng này chỉ hỗ trợ tiếng Anh. Trong nước, một số tổ chức nghiên cứu đã bắt đầu chú ý nhiều hơn đến phát triển loại công nghệ nhận dạng tiếng Việt, nhưng mới chỉ đề cập ở mức độ ban đầu. Khó khăn lớn nhất trong nhận dạng tiếng Việt là âm sắc, ngữ điệu, cấu trúc ngữ pháp rất phức tạp, không thể áp dụng các công nghệ nhận dạng tiếng nói có sẵn trên thế giới.

Do đó, sự ra đời của chíp iHearTech cùng thiết bị cầm tay nhận dạng tiếng nói của PGS-TS Hoàng Trang cùng các nhà khoa học tại Trường Đại học Bách Khoa TPHCM được coi là bước đột phá về công nghệ nhận dạng giọng nói tiếng Việt, tạo thêm cơ hội để người khiếm thị Việt Nam hòa nhập cộng đồng nhiều hơn, tiếp cận với nguồn thông tin vô tận trên internet.

GIA QUẢNG

Tin cùng chuyên mục