ChatGPT Voice Just Got a Major Upgrade—Is This the End of Typing for Good?
ChatGPT语音功能大升级——这是否意味着打字将彻底成为过去?

techcrunch.com
But here’s the irony: we’re building AI that mimics conversation, yet still requires us to tap an 'end' button to stop it from talking. It’s not a true dialogue—it’s a high-tech ventriloquist act where we’re the ones moving our lips.
但颇具讽刺意味的是:我们正在打造模仿对话的AI,却仍需要手动点击‘结束’按钮才能让它闭嘴。这并非真正的对话——更像是一场高科技腹语表演,而我们才是那个在动嘴的人。
终于来了!无缝语音整合才叫真正的以用户为中心的设计。再也不用在不同模式间来回切换——这正是我们一直苦苦哀求的无摩擦体验。这不只是一次更新,更是一种宣言。
我上周试了语音模式,结果屏幕突然变成全蓝,只有一个圆圈,我完全懵了,还以为坏了。现在说话时能看到文字了?太棒了。这下我就能记住它说了什么。
哇哦,现在我边说话还能边看文字了?真是革命性突破啊。下一步是不是还能边呼吸边打字?这根本不是创新——这只是他们早在几年前就该交付的基本可用性。
作为一个发布过15次以上语音功能更新的开发者,我理解这其中的精妙之处。合并模式不只是界面调整——它需要对状态管理和音频生命周期处理进行深度重构。敬礼。
方便?当然。但每次语音交互都是一串数据足迹。现在语音嵌入了聊天,是否意味着我的话语会被更久存储?转录?共享?透明度依然缺失。
对那位怀疑论者:诚然,理想情况下这本应更早推出。但将真正的用户体验进步贬为‘基本功能’,会抹杀成千上万人为这些细节奋斗的努力。并非每个胜利都需要被描绘为迟到的。
我才不管什么模式、数据或开发者纷争。我只是问ChatGPT要了个煎饼食谱,想边做饭边听。现在我可以听着还能瞄一眼列表。对我来说简直是巨大胜利。