Wait—ChatGPT Voice is finally not a clunky nightmare? Did OpenAI just fix the UX disaster?
Khoan đã—ChatGPT Voice giờ hết khó chịu rồi á? Hay là OpenAI vừa sửa xong thảm họa trải nghiệm người dùng?

OpenAI cuối cùng cũng nghe theo—ChatGPT Voice giờ không còn là chế độ riêng biệt nữa. Giờ bạn có thể nói chuyện, xem câu trả lời hiện lên ngay lập tức, thậm chí xem cả hình ảnh hay bản đồ ngay giữa cuộc trò chuyện. Không còn bỏ lỡ câu trả lời vì lỡ nghe nhầm câu nói.
Đây không chỉ là thay đổi giao diện—mà là bước tiến lớn về tính tiện dụng. Tưởng tượng bạn hỏi đường khi đang lái xe: giờ bạn có thể nghe lộ trình, xem bản đồ và kiểm tra lại tin nhắn cũ mà không cần chuyển màn hình. Vẫn phải bấm 'dừng giọng nói', nhưng đổi lại là trải nghiệm vượt trội—đáng bỏ công.
Là người từng dùng chế độ giọng nói khi đi làm, tôi xin xác nhận—việc chuyển tới chuyển lui giữa chế độ text và giọng nói giống như đang du hành thời gian trong cõi đau khổ của giao diện. Giờ thì tôi dùng được ngoài đời thật rồi. OpenAI ơi, chuyện gì thay đổi vậy?
Họ đã tích hợp modal lại làm một. Về lý thuyết thì đơn giản, nhưng rõ ràng đội kỹ thuật đã giải quyết được độ phức tạp trong quản lý trạng thái. Đây mới là 'thiết kế lấy người dùng làm trung tâm', khi các sếp ngừng áp đặt lên đội sản phẩm.
Một chiến thắng lớn cho khả năng tiếp cận! Việc xem được phản hồi bằng văn bản trong thời gian thực là bước đột phá cho người nghe kém. Suốt vài năm, tính năng giọng nói đã loại chúng tôi ra. Cảm ơn vì cuối cùng đã nghĩ đến việc bao gồm mọi người.
Khoan, thế này chỉ là ChatGPT đuổi kịp Siri năm 2014 thôi à? Chúng tôi đã có cả giọng nói lẫn văn bản trên iOS suốt một thập kỷ rồi. OpenAI đang đuổi theo, chứ chẳng phải đi đầu gì cả.
Tôi không quan tâm ai làm trước. Tôi chỉ quan tâm là giờ tôi có thể dùng cùng lúc cả cách tư duy bằng lời nói và hình ảnh của não bộ. Với người dị biệt thần kinh, đây không phải sự tiện lợi—mà là giải phóng nhận thức.
Tuyệt vời cho mấy ai đủ tiền mua Plus. Còn phần còn lại chúng tôi vẫn không dùng Voice được. Đổi mới cho giới đặc quyền, chứ không phải cho công chúng.
Sự tích hợp này chứng minh AI hội thoại đa phương thức mới là tương lai. Không phải chỉ text, cũng không phải chỉ giọng nói, mà là sự chuyển đổi linh hoạt giữa các kiểu nhập liệu. Cuộc đua vừa nóng thêm rồi.