Đề tài "Lập trình ứng dụng AI nhận diện cảm xúc giao tiếp với người câm điếc" của thầy Nguyễn Hoàng Hải Đăng, Trường THPT Bình Tân (TPHCM) đã đoạt giải ba - Giải thưởng Tiên phong ứng dụng AI trong giáo dục do Bộ GD-ĐT phối hợp với Trường ĐH RMIT Việt Nam vừa tổ chức.

Thầy Đăng cho biết người câm điếc vẫn đang phải đối mặt với nhiều rào cản trong giao tiếp hằng ngày khiến việc trao đổi thông tin trở nên khó khăn và ảnh hưởng đến khả năng hòa nhập, học tập và chất lượng cuộc sống của họ.

“Trong giao tiếp, cảm xúc đóng vai trò rất quan trọng. Tuy nhiên, phần lớn các giải pháp hỗ trợ người câm điếc hiện chỉ dừng lại ở việc chuyển đổi ngôn ngữ ký hiệu sang văn bản hoặc giọng nói mà chưa chú trọng đến yếu tố cảm xúc” - thầy Đăng chia sẻ.

Đề tài của thầy Đăng đã đoạt giải ba Giải thưởng Tiên phong ứng dụng AI trong giáo dục

Khi AI được ứng dụng nhiều trong các hoạt động giảng dạy, thầy Đăng trăn trở với câu hỏi: AI có thể giúp người câm điếc không chỉ “nghe” được nội dung mà còn “cảm” được cảm xúc của người đối diện hay không? Chính câu hỏi này khiến thầy bắt tay vào quá trình xây dựng và nghiên cứu, triển khai đề tài.

Theo thầy Đăng, thách thức lớn nhất khi thực hiện đề tài là việc phải tiếp cận và làm chủ các công nghệ AI trong điều kiện vừa giảng dạy vừa nghiên cứu. Đó là không có lợi thế về phòng thí nghiệm chuyên sâu hay đội ngũ hỗ trợ kỹ thuật; mọi khâu từ thiết kế ý tưởng, xây dựng thuật toán đến lập trình đều được thực hiện độc lập.

“Có những giai đoạn tôi phải tự học từ đầu các kiến thức về xử lý ảnh, học máy, học sâu. Việc cân bằng giữa công việc giảng dạy và nghiên cứu đòi hỏi rất nhiều nỗ lực và sự kiên trì” - thầy Đăng cho biết.

Thuyết trình đề tài với ban tổ chức

Để vượt qua khó khăn, thầy Đăng chủ động tìm kiếm tài liệu chuyên ngành, tham gia các khóa học trực tuyến, đồng thời thử nghiệm, điều chỉnh mô hình nhiều lần cho đến khi đạt được kết quả mong muốn. Quá trình nghiên cứu kéo dài với nhiều lần thất bại nhưng chính những sai sót đó lại giúp thầy dần hoàn thiện sản phẩm.

Hệ thống tích hợp các mô hình AI để thực hiện hai chức năng chính: Hỗ trợ giao tiếp bằng ngôn ngữ ký hiệu và nhận diện cảm xúc thông qua biểu cảm khuôn mặt. Cụ thể, ứng dụng sử dụng thuật toán YOLO-crop để nhận diện cử chỉ tay, LSTM để xử lý chuỗi hành động liên tiếp và MobileNet để phân loại ngôn ngữ ký hiệu. Đối với phần nhận diện cảm xúc, hệ thống phân tích các đặc điểm trên khuôn mặt nhằm xác định trạng thái cảm xúc cơ bản của người giao tiếp.

Theo đánh giá của Ban tổ chức, đề tài có tính mới mẻ, tính ứng dụng cao và đặc biệt mang đậm yếu tố nhân văn, phù hợp với định hướng phát triển giáo dục hòa nhập.

Thầy Đăng mong muốn AI không còn là khái niệm xa vời mà trở thành công cụ phục vụ con người, đặc biệt là những nhóm yếu thế trong xã hội. Đồng thời, sẽ tiếp tục hoàn thiện đề tài bằng cách mở rộng tập dữ liệu huấn luyện, nâng cao độ chính xác của hệ thống nhận diện cảm xúc, đồng thời nghiên cứu khả năng triển khai ứng dụng trong môi trường giáo dục và cộng đồng.