Mô hình tạo ảnh mới Images 2.0 trên ChatGPT của OpenAI đang thu hút sự chú ý của giới công nghệ và cả người dùng tại Việt Nam khi lần đầu tiên văn bản trong ảnh được xử lý gần như chính xác, ngay cả với tiếng Việt, khắc phục điểm yếu cố hữu của các thế hệ AI trước đây.
Nếu như cách đây 2 năm, các công cụ như DALL-E 3 thường xuyên mắc lỗi chính tả, thậm chí "bịa" ra từ ngữ khi tạo hình ảnh chứa văn bản, thì nay Images 2.0 có thể tạo ra một thực đơn nhà hàng hoàn chỉnh với nội dung rõ ràng, tự nhiên, khó phân biệt với sản phẩm do con người thiết kế.

Tạo một menu nhà hàng bằng tiếng Việt bởi ChatGPT
Qua thử nghiệm thực tế với tiếng Việt, chúng tôi ghi nhận so với phiên bản Image 1.5 ra mắt cuối năm ngoái, ChatGPT tích hợp Images 2.0 cho khả năng tạo ảnh nhanh hơn và độ chính xác cao hơn.
Văn bản tiếng Việt hiển thị gần như không gặp lỗi chính tả hay sai lệch ký tự, kể cả với nội dung dài. Ngoài ra, người dùng có thể tùy chọn nhiều tỉ lệ khung hình như vuông, chân dung, ngang hoặc màn ảnh rộng.
Theo phản hồi từ cộng đồng, Images 2.0 của OpenAI đang tạo áp lực cạnh tranh đáng kể lên các đối thủ, trong đó có Nano Banana Pro của Google.
"Sau khi Google ra Nano Banana Pro thì cuối cùng ChatGPT cũng tham gia cuộc chơi với Image 2.0. Nó hiểu tiếng Việt rõ hơn, cấu trúc câu lệnh chi tiết hơn. Kiểu này mấy anh làm menu dạo tha hồ mà nhận đơn" - một người dùng mạng xã hội nói vui.
Dù chưa công bố chi tiết công nghệ, OpenAI cho biết Images 2.0 được tích hợp khả năng "tư duy", có thể tự kiểm tra kết quả, tìm kiếm thông tin và tạo nhiều biến thể hình ảnh từ một yêu cầu.
Nhờ đó, mô hình có thể thiết kế các sản phẩm phức tạp như ấn phẩm marketing, giao diện hoặc truyện tranh nhiều khung với độ chi tiết cao.
Bên cạnh đó, khả năng hiển thị chữ ngoài bảng chữ cái Latin như tiếng Nhật, Hàn hay Hindi cũng được cải thiện rõ rệt. Độ phân giải đầu ra có thể đạt tới 2K, giúp tái hiện tốt các chi tiết nhỏ, biểu tượng và bố cục dày đặc - những yếu tố từng là hạn chế lớn của AI tạo ảnh trước đây.

Người dùng hài lòng với menu được tạo bởi Images 2.0 của OpenAI
Images 2.0 đã được cung cấp cho toàn bộ người dùng ChatGPT và Codex. Trong đó, người dùng trả phí có thể tiếp cận thêm các tùy chọn nâng cao. Đồng thời, OpenAI cũng mở API gpt-image-2 với mức giá phụ thuộc vào chất lượng và độ phân giải đầu ra.
Với những cải tiến này, tình trạng sai lỗi chính tả khi tạo ảnh bằng AI gần như đã được khắc phục, mở ra nhiều ứng dụng thực tiễn trong thiết kế và truyền thông.

Không còn xảy ra hiện tượng sai lỗi chính tả khi tạo bởi AI
Bình luận (0)