Zalo đoạt giải nhất cuộc thi xử lý ngôn ngữ tự nhiên và tiếng nói

Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm khoa học và công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐH Quốc gia Hà Nội) tổ chức, Zalo đoạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

Đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1.000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình của các đội thi phải tạo ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh. 

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

Tin cùng chuyên mục