ChatGPT Voice Just Got Real: No More Switching Modes—Is This the End of Typing?
مود الصوت في شات جي بي تي أصبح واقعًا: لا مزيد من التبديل بين الأوضاع — هل نحن أمام نهاية الكتابة؟

قامت OpenAI للتو بإنهاء عذاب 'الدائرة الزرقاء' المزعجة حيث كنت عالقًا في وضع الصوت، لا يمكنك مراجعة الرسائل السابقة ولا رؤية العناصر المرئية. الآن يمكنك التحدث، ورؤية ردود شات جي بي تي فورًا، والانتقال للخلف في المحادثة، وحتى مشاهدة الصور والخرائط أثناء الحديث. بصراحة، هذا يجعل التجربة أقل شبهاً بالحديث مع جهاز محمصة ذكية، وأكثر قربًا من محادثة حقيقية.
العثرة الوحيدة؟ لا يزال يتعين عليك الضغط على 'إنهاء' لإنهاء المكالمة فعلًا. إنها نقطة تَوَقّف بسيطة في ترقية سلسة بشكل عام. لكن مع ذلك، أخيرًا، دخل الصوت والنص في خيط محادثة واحد. بهذه الطريقة بالضبط يفترض أن يعمل الذكاء الاصطناعي متعدد الوسائط.
أخيرًا! يمكنني سؤال شات جي بي تي عن كيفية منع طفلي من رمي حبوب البازلاء على الكلب وفي نفس الوقت قراءة رده ومشاهدة وصفة البازلاء التي أهدرتها للتو.
إذًا أصبح الميكروفون نشطًا دائمًا داخل المحادثة الأساسية؟ أم ما زال يتعين علي 'تفعيل' الصوت؟ لأنه إن كان يستمع طوال الوقت، فأنا أرحل.
الميكروفون ليس شغال طوال الوقت. لا يزال يتعين عليك النقر للبدء، لكنك الآن تظل داخل سياق المحادثة الكامل. هذا هو الفوز الحقيقي.
هذا تقدّم في سهولة الاستخدام، نعم — لكننا نخطو بخطوات نعسانة نحو ذكاء اصطناعي دائم الحضور. أصبح الخط الفاصل بين المساعد والمُراقب رفيعًا جدًا. 'اضغط للتحدث' هو الحاجز الأخير. دعونا لا نفقده.
قمت بالتحديث للتو. يعمل بسلاسة. أستطيع أخيرًا أن أقول 'يا جي بي تي، ذكّرني بشراء الحليب' وأنا أتحقق مما إذا كنت قد أدخلته مسبقًا. غيّر قواعد اللعبة.
إذًا يتكلم ويعرض الصور الآن؟ يبدو مثل أحفادي. بصراحة، سألتزم بمحمصتي. تحضّر التوست. لا تحكم عليَّ.
تحول مذهل: لم نعد نستخدم الذكاء الاصطناعي كأداة. نحن في علاقة معه. يذكر. يرى. يتكلم. قريبًا سيقاطعنا. هذا ليس تصميم واجهة. هذه هندسة الحميمية.