Dự án kính thực tế ảo có thể phiên dịch ngôn ngữ trong thời gian thực

Dựa trên dự án kính đeo mắt thực tế ảo tăng cường (Augmented Reality) Google Glass, lập trình viên máy tính Will Powell đã vừa phát triển nguyên mẫu đầu tiên của hệ thống phiên dịch thời gian thực có thể lắng nghe lời nói, dịch sang 37 ngôn ngữ và hiển thị kết quả theo dạng phụ đề trực tiếp trên kính.

Powell sử dụng một tai nghe Bluetooth để thu lại các tín hiệu âm thanh. Tai nghe được kết nối với một điện thoại thông minh hoặc máy tính bảng nhằm đảm bảo âm thanh đầu vào rõ ràng với tạp âm được lọc bỏ. Tín hiệu sau đó được gởi đến dịch vụ Microsoft Translator để nhận biết ngôn ngữ đã ghi và phiên dịch sang ngôn ngữ theo tùy chọn. Cuối cùng, văn bản phiên dịch được hiển thị trên phần dưới của mắt kính - mang lại hiệu ứng phụ đề theo thời gian thực.

img

Giao diện phụ đề và hình ảnh được trình chiếu trên màn hình TV trong đoạn video demo được hỗ trợ bởi 2 vi mạch máy tính của Raspberry Pi hiện đang được bán với giá 35 USD mỗi chiếc.

img
Bạn cài Flash Player để xem được Clip này.

Video trình diễn ý tưởng kính phiên dịch ngôn ngữ. Nguồn: Youtube

Kết quả cho thấy hệ thống có độ phản hồi khá tốt mặc dù vẫn còn chậm đối với các ứng dụng thời gian thực. Sự chậm trễ trong khâu phiên dịch chủ yếu là do máy chủ Translator cần thời gian để xử lý thông tin cũng như lưu tạm các diễn đạt phổ biến.

Những chiếc kính Vuzix Star 1200 mà Powell sử dụng hoàn toàn trong suốt giống màn hình HUD của phi công có giá bán lẻ lên đến 4999 USD. Hơn nữa, chất lượng phiên dịch có thể bị ảnh hưởng nhiều nếu người hội thoại không đeo tai nghe hay một chiếc kính tương tự để nâng cao chất lượng âm thanh.