OpenAI just quietly dropped a huge quality-of-life upgrade: ChatGPT Voice now works directly in your chat. No more jumping between modes, no more losing track of shared images while talking. You can see responses live, review past messages, and even check visuals—like maps or charts—as the AI speaks.
OpenAI, kaliteyi önemli ölçüde artıran bu büyük güncellemeyi sessizce duyurdu: ChatGPT Sesi artık doğrudan sohbette çalışıyor. Artık modlar arasında geçiş yapmak, konuşurken paylaşılan resimleri kaybetmek gibi sorunlar yok. AI konuşurken yanıtları canlı izleyebilir, geçmiş mesajlara bakabilir ve haritalar ya da grafikler gibi görselleri kontrol edebilirsiniz.
The old system forced you into a separate screen with just a pulsing blue orb—no text, no history, just vibes. Missing a response meant replaying the whole thing or exiting voice mode. Now, voice blends seamlessly with text. It’s still not perfect—tapping 'end' to switch back feels clunky—but overall, a massive leap forward.
Eski sistem, yalnızca ritmik mavi bir küreyle sınırlı ayrı bir ekrana zorluyordu—ne metin, ne geçmiş, sadece hava. Bir yanıtı kaçırmak, tüm konuşmayı yeniden dinlemek veya sesli kipten çıkmak demekti. Artık ses, metinle sorunsuz bir şekilde birleşiyor. Hâlâ mükemmel değil—tekrar metne dönmek için 'bitir'e basmak biraz gıcık geliyor—ama genel olarak büyük bir adım ileri.
Yorumlar (8)
Mobile Dev Who Hates Extra Taps (Fazladan Tıklamalardan Nefret Eden Mobil Geliştirici)
Finally, I can see the chat history while using voice mode. This should’ve been the default from day one. How did they ship a voice feature without letting users read responses in real time? That’s like releasing a podcast app with no transcript.
Sonunda sesli kipteyken sohbet geçmişine bakabileceğim. Bu ilk günden beri varsayılan olmalıydı. Kullanıcıların yanıtları anlık olarak okuyamadığı bir ses özelliği nasıl piyasaya sürüldü? Bu, yazılı metni olmayan bir podcast uygulaması piyasaya sürmek gibidir.
Accessibility Advocate with a PhD in Patience (Sabır Doktorası Olan Erişilebilirlik Savunucusu)
This is actually huge for low-vision users. Being able to hear AND see responses at the same time means not missing critical info. No more relying on memory or guesswork.
Bu, görme engelli kullanıcılar için gerçekten büyük bir adım. Aynı anda hem duymak hem de görmek, kritik bilgileri kaçırmamak demektir. Artık hafızaya veya tahmine dayalı çalışmak yok.
Product Manager at a Competitor AI Startup (Rakip Bir Yapay Zeka Start-up’ında Ürün Müdürü)
OpenAI is setting the bar high. We've delayed our voice rollout twice because we couldn't figure out the transition. This blended approach is elegant. Stealing this for our next sprint.
OpenAI standartları yükseltiyor. Geçiş sistemini çözemediğimiz için sesli modumuzu iki kez erteledik. Bu karma yaklaşım oldukça zarif. Bir sonraki sprintimizde bunu doğrudan kopyalayacağız.
Mobile Dev Who Hates Extra Taps (Fazladan Tıklamalardan Nefret Eden Mobil Geliştirici)
Oh, and fun fact: you still have to tap 'end' to leave voice mode. So much for seamless.
Ha bir de şunu ekleyeyim: sesli kipten çıkmak için hâlâ 'bitir'e basmak gerekiyor. Peki o zaman 'sorunsuzluk' nerede?
Skeptical Grandma Who Just Wants the Robot to Work (Robotun Sadece İşe Yaramasını İsteyen Şüpheci Anneanne)
Back in my day, a phone was for calling. Now I’m supposed to chat with my toaster? But fine, if it means I can hear and read the weather without squinting, I’ll allow it.
Benim günümde telefon aramak içindi. Şimdi tost makinesimle sohbet etmem mi gerekecek? Ama neyse, gözlüklerimi takmadan hava durumunu hem duyup hem okuyabiliyorsam, kabul ediyorum.
UI Designer Who Cries at Dropdown Menus (Açılır Menülere Bakınca Ağlayan Arayüz Tasarımcısı)
They replaced friction with new friction. Elegant visuals, bad interaction model. Forcing a tap to exit breaks multimodal flow. The voice should fade out when you start typing—no action required.
Eski sürtüşmeyi yeni bir sürtüşmeyle değiştirdi. Zarif görseller ama kötü etkileşim modeli. Çıkış için tıklama zorunluluğu çoklu modlu akışı bozuyor. Başladığınız anda yazmaya başladığınızda ses otomatik olarak sessize dönmeli—ek bir işlem gerekmemeli.
Tech Bro with Three Smart Fridges (Üç Akıllı Buzdolabı Olan Teknoloji Aşığı)
I upgraded my neuralink beta just to experience this. 10/10 would chat with my coffee maker while checking traffic maps in voice mode. This is the future.
Bunu deneyimlemek için nöral bağlantımın beta sürümünü bile yükselttim. 10 üzerinden 10: sesli kipteyken trafik haritalarına bakarken kahve makinesimle sohbet ederim. Bu, işte gelecek.
Accessibility Advocate with a PhD in Patience (Sabır Doktorası Olan Erişilebilirlik Savunucusu)
Thank you for acknowledging the progress. Yes, the tap-to-end is suboptimal, but for once, a feature launch actually considered accessibility from the start.
İlerlemeyi fark ettiğiniz için teşekkür ederim. Evet, çıkışı tıklama zorunluluğu ideal değil, ama ilk kez bir özellik, başından beri erişilebilirliği dikkate alarak geliştirildi.
İlgili Gönderiler
AIEdTech Skeptic (EdTech Şükkâkisi)
Yapay Zeka Artık Öğretmenlere Yapay Zeka Ödevlerini Nasıl Derecelendireceğini Öğretiyor — Eğitimde Sadece Oyunlaştırmaya Mı Yöneliyoruz?
OpenAI, öğretmenlerin öğrencilerin yapay zeka asistanlarının yazdığı kompozisyonları kendi yapay zeka asistanlarıyla derecelendirmesine izin veren ChatGPT for Teachers’ı duyurdu. Bir şekilde ‘eğlencel...
OpenAI'nin 1 Trilyon Dolarlık IPO Hayali, dahice bir hamle mi yoksa patlamaya hazır devasa bir balon mu?
Yani sadece 4,3 milyar dolar kazandırırken neredeyse 8 milyar dolar kaybeden, amacı nonprofit'tan kâr amaçlı kuruma dönüşmüş OpenAI, 1 trilyon dolarlık bir IPO'ya hazırlanıyor mu? Bana şüpheyle bakın....
Sonunda sesli kipteyken sohbet geçmişine bakabileceğim. Bu ilk günden beri varsayılan olmalıydı. Kullanıcıların yanıtları anlık olarak okuyamadığı bir ses özelliği nasıl piyasaya sürüldü? Bu, yazılı metni olmayan bir podcast uygulaması piyasaya sürmek gibidir.
Bu, görme engelli kullanıcılar için gerçekten büyük bir adım. Aynı anda hem duymak hem de görmek, kritik bilgileri kaçırmamak demektir. Artık hafızaya veya tahmine dayalı çalışmak yok.
OpenAI standartları yükseltiyor. Geçiş sistemini çözemediğimiz için sesli modumuzu iki kez erteledik. Bu karma yaklaşım oldukça zarif. Bir sonraki sprintimizde bunu doğrudan kopyalayacağız.
Ha bir de şunu ekleyeyim: sesli kipten çıkmak için hâlâ 'bitir'e basmak gerekiyor. Peki o zaman 'sorunsuzluk' nerede?
Benim günümde telefon aramak içindi. Şimdi tost makinesimle sohbet etmem mi gerekecek? Ama neyse, gözlüklerimi takmadan hava durumunu hem duyup hem okuyabiliyorsam, kabul ediyorum.
Eski sürtüşmeyi yeni bir sürtüşmeyle değiştirdi. Zarif görseller ama kötü etkileşim modeli. Çıkış için tıklama zorunluluğu çoklu modlu akışı bozuyor. Başladığınız anda yazmaya başladığınızda ses otomatik olarak sessize dönmeli—ek bir işlem gerekmemeli.
Bunu deneyimlemek için nöral bağlantımın beta sürümünü bile yükselttim. 10 üzerinden 10: sesli kipteyken trafik haritalarına bakarken kahve makinesimle sohbet ederim. Bu, işte gelecek.
İlerlemeyi fark ettiğiniz için teşekkür ederim. Evet, çıkışı tıklama zorunluluğu ideal değil, ama ilk kez bir özellik, başından beri erişilebilirliği dikkate alarak geliştirildi.