Hệ thống SYNC có thể hiểu được các khẩu lệnh bằng cách nào?

SGGP
Đâu là nguồn cảm hứng cho con người làm việc hàng ngày? Đối với ông Stephen Cooper, trưởng nhóm nghiên cứu và phát triển công nghệ nhận diện giọng nói SYNC® 3, nguồn cảm hứng cho những đóng góp của ông vào hệ thống này xuất phát từ cảm giác an tâm khi biết người thân và bạn bè của ông được tập trung lái xe an toàn và không bị xao nhãng.

Hệ thống SYNC có thể hiểu được các khẩu lệnh bằng cách nào?

Sau nhiều lần chứng kiến những hậu quả đến từ việc lái xe mất tập trung, ông Cooper nhận ra sự cấp thiết trong việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ còn một câu lệnh. “Tôi đã gặp nhiều vụ tai nạn xảy ra do tài xế mất tập trung khi lái xe, và điều đó đã thôi thúc tôi nghiên cứu và phát triển công nghệ này”-ông Cooper chia sẻ. “Nhờ giảm thiểu tối đa sự phân tâm cũng như dễ dàng vận hành, hệ thống kích hoạt bằng giọng nói sẽ đảm bảo tài xế tập trung điều khiển xe một cách an toàn”.

Ông Cooper là nhân sự thuộc nhóm Phát triển Công nghệ Nhận diện Giọng nói của Ford tại trụ sở Dearborn, Michigan - đơn vị chịu trách nhiệm phát triển các tính năng cho hệ thống SYNC® 3. Việc xây dựng một hệ thống kích hoạt bằng giọng nói đơn giản và phù hợp cho khách hàng là một trong những mục tiêu chính của nhóm. Công nghệ kích hoạt bằng giọng nói đã trở thành một phần của hệ thống SYNC® ngay từ những phiên bản đầu tiên cách đây 13 năm. Chính thức ra mắt vào năm 2014, SYNC® 3 đã và đang được cải tiến không ngừng. Hiện nay, với khả năng hỗ trợ lên tới 25 ngôn ngữ, hệ thống này đã đem đến cơ hội trải nghiệm cho nhiều người dùng trên toàn thế giới hơn.

SYNC® đã hiểu lời nói của chúng ta như thế nào?

Là trang bị tiêu chuẩn trên nhiều dòng xe khác nhau của Ford, SYNC® đã có bước phát triển vượt bậc - trở thành một trong những hệ thống kích hoạt bằng giọng nói trực quan và tiên tiến nhất hiện nay. Thiết kế cốt lõi SYNC® là hệ thống nhận diện và ra lệnh bằng giọng nói - hoạt động giống như một bộ não nhận diện giọng nói. Cụm dữ liệu ngôn ngữ tích hợp với phần mềm giải mã sẽ chia nhỏ âm thanh để phân tích và hiểu từng câu mệnh lệnh của người dùng. Cụm dữ liệu ngôn ngữ là một danh sách lớn các từ ngữ hoặc câu lệnh được lập trình để thực hiện một nhiệm vụ cụ thể. Ví dụ như câu lệnh “Gọi John Doe”, sẽ được ghi nhận bằng hơn 25 ngôn ngữ trên hệ thống SYNC®. Ngoài ra, một lượng lớn câu lệnh tương ứng với các tính năng (có thể kích hoạt bằng giọng nói trong) trên xe cũng được lưu trữ trong cụm dữ liệu ngôn ngữ của SYNC®…

Bên cạnh đó phần mềm giải mã giọng nói sẽ lọc ra đặc tính âm thanh của từng câu lệnh để khớp với danh sách các từ trong cụm dữ liệu ngôn ngữ. Như ví dụ trên, khi người dùng nói “Gọi John Doe”, phần mềm giải mã sẽ phân tích đặc tính của đoạn âm thanh thu được, sau đó tìm kiếm trong cụm dữ liệu ngôn ngữ để tìm ra mệnh lệnh (được lưu sẵn) có đặc tính âm thanh tương tự, qua đó giúp hệ thống SYNC® hiểu được yêu cầu từ người sử dụng…

Hệ thống SYNC có thể hiểu được các khẩu lệnh bằng cách nào? ảnh 1


Đặt con người vào vị trí trung tâm của sự phát triển

Nhóm Phát triển Công nghệ Nhận diện Giọng nói của Ford được lãnh đạo bởi bà Yvonne Gloria, người đã có những đóng góp đáng kể trong quá trình cải tiến công nghệ này, kể từ khi SYNC® 3 ra mắt công chúng vào năm 2014. Là một chuyên gia kỹ sư phần mềm, bà Gloria chia sẻ rằng sự đơn giản chính là chìa khóa dẫn đến thành công của hệ thống SYNC®. “Đa số người sử dụng phần mềm của chúng tôi đều không phải là kỹ sư. Chính vì vậy, chúng tôi đã phát triển phần mềm này để phục vụ những mục đích cụ thể và thực tế, nhưng không thể ép buộc khách hàng phải có một cái nhìn tương tự về sản phẩm. Điều này đã thúc đẩy tôi đặt mình vào suy nghĩ của một khách hàng, chứ không phải của một kỹ sư, từ đó, nghiên cứu cách những người dùng phổ thông tìm hiểu và ứng dụng công nghệ” - Bà Gloria cho biết… “Chúng tôi liên tục theo dõi các phản hồi từ thị trường mục tiêu để nâng cấp tính năng và tạo ra các phiên bản cập nhật mới nhất. Công việc này sẽ liên tục được duy trì cho đến khi vòng đời sử dụng của sản phẩm kết thúc” - Ông Cooper chia sẻ thêm.

Tương lai của công nghệ kích hoạt bằng giọng nói

“Rất nhiều cơ hội được mở ra cho các phương tiện được trang bị SYNC®, nhằm nâng tầm trải nghiệm của tài xế” - bà Gloria giải thích. “Đặc biệt, công nghệ hiện nay đang phát triển nhanh chóng và các màn hình giải trí cỡ lớn trên xe sẽ dần thay thế những nút bấm truyền thống, tạo nên một sân chơi đầy tiềm năng cho công nghệ kích hoạt bằng giọng nói trong tương lai”.

NH.NG

Các tin, bài viết khác

Thị trường

Địa ốc

Tổng giao dịch bất động sản năm 2021 đạt 61.766 sản phẩm

Theo Hiệp hội Bất động sản Việt Nam, năm 2021, tổng sản phẩm chào bán trên thị trường cả nước đạt 165.742 sản phẩm; tổng lượng giao dịch cả nước đạt 61.766 sản phẩm. Như vậy, tương quan cung cầu đã có sự chênh lệch rất lớn.

Ngân hàng - Chứng khoán

Nông nghiệp

“Mắc màn lưới” bảo vệ cam Khe Mây đặc sản ở Hà Tĩnh

Từ lâu nay, xã Hương Đô được biết đến là “vựa” cam Khe Mây - đặc sản nổi tiếng nhất ở huyện miền núi Hương Khê (tỉnh Hà Tĩnh). Đây cũng là cây trồng chủ lực phát triển kinh tế, mang lại nguồn thu nhập cho hàng trăm hộ dân. Hàng năm, ngoài việc chăm sóc đúng kỹ thuật, an toàn, người dân nơi đây còn sáng tạo "mắc màn lưới" để bảo vệ cam Khe Mây được hiệu quả tốt nhất.

Đầu tư

Chuyển động kinh tế & Đời sống 24H

Vedan Việt Nam đồng hành xây 24 bể chứa bao gói thuốc bảo vệ thực vật đã qua sử dụng

Từ nhiều năm nay, bảo vệ môi trường và kiến tạo cuộc sống tốt đẹp hơn luôn là kim chỉ nam Vedan Việt Nam hướng đến. Cuối tháng 11 vừa qua, công ty đã phối hợp cùng các cơ quan ban ngành liên quan về môi trường thiên nhiên huyện Vĩnh Cửu, tỉnh Đồng Nai góp phần xây dựng 24 bể lưu chứa bao gói thuốc bảo vệ thực vật đã qua sử dụng trên địa bàn 4 xã: Bình Lợi, Thiện Tân, Tân An và Hiếu Liêm thuộc địa bàn huyện.

Chuyển động kinh tế & Đời sống 24H

Thông tin kinh tế