xem thêm
An Giang
Bình Dương
Bình Phước
Bình Thuận
Bình Định
Bạc Liêu
icon 24h qua
Đăng nhập
icon Đăng ký gói bạn đọc VIP

Cải thiện nhận dạng tiếng nói qua AI

T.Phượng

Nghiên cứu hỗ trợ nâng cấp các mô hình nhận dạng tiếng nói, tăng độ chính xác của tính năng soạn tin nhắn bằng giọng nói và chuyển tin nhắn thoại thành văn bản trên ứng dụng Zalo

Công trình nghiên cứu về cải thiện nhận dạng tiếng nói thời gian thực do kỹ sư đến từ Zalo AI Lê Duy Khánh (SN 2000) thực hiện đã được chọn công bố tại Hội nghị Khoa học về Xử lý tiếng nói, dự kiến diễn ra ở Hy Lạp vào tháng 9-2024.

Nghiên cứu này hỗ trợ nâng cấp các mô hình nhận dạng tiếng nói, tăng độ chính xác của tính năng soạn tin nhắn bằng giọng nói và chuyển tin nhắn thoại thành văn bản trên ứng dụng Zalo; cho phép người dùng soạn tin nhắn bằng giọng nói, giúp tiết kiệm thời gian và tiện lợi trong nhiều tình huống. Độ chính xác của tính năng này đạt tới 95% trong môi trường thực tế, với tỉ lệ cần chỉnh sửa văn bản sau khi soạn qua giọng nói giảm còn 4,8%.

Theo Zalo, dù công trình nghiên cứu trên vẫn còn trong giai đoạn thử nghiệm nhưng đã thu hút khoảng 3,2 triệu người dùng hằng tháng (cập nhật đến tháng 6-2024) với gần 4,5 triệu tin nhắn mỗi ngày. Nghiên cứu này còn có tiềm năng ứng dụng rộng rãi để nâng cấp chatbot giọng nói, trợ lý giọng nói hoặc tính năng tự động tạo bản ghi cho các cuộc gọi video... 

Lên đầu Top

Bạn cần đăng nhập để thực hiện chức năng này!

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.

Thanh toán mua bài thành công

Chọn 1 trong 2 hình thức sau để tặng bạn bè của bạn

  • Tặng bằng link
  • Tặng bạn đọc thành viên
Gia hạn tài khoản bạn đọc VIP

Chọn phương thức thanh toán

Tài khoản bạn đọc VIP sẽ được gia hạn từ  tới

    Chọn phương thức thanh toán

    Chọn một trong số các hình thức sau

    Tôi đồng ý với điều khoản sử dụng và chính sách thanh toán của nld.com.vn

    Thông báo