ChatGPT'nin sesli çalışması, sesli asistanların asla akıllı telefonunuzun yerini almayacağını gösteriyor

ChatGPT sesli dikte özelliğini tanıttı, ancak hiçbir zaman gerçek anlamda başarılı olamamasının bir nedeni var

Temel Çıkarımlar

  • OpenAI yakın zamanda ChatGPT'nin kullanıcılarla sesli etkileşim kurabileceğini duyurdu.
  • Sesli dikte teknolojisinin yaygın olarak benimsenmesini engelleyen kusurları vardır. Yanıtları kendiniz hızla bulabilmek varken neden sesli asistanların uzun yanıtlarıyla uğraşasınız ki?
  • Güvenlik eksikliği ve mikrofonların her zaman dinlenmesi riski nedeniyle gizlilik, sesli asistanlar için de büyük bir endişe kaynağıdır.
  • Özel sesle çalışan cihazların, pratik nedenler ve kullanıcı tercihleri ​​nedeniyle gerçeğe dönüşmesi pek olası değildir. Sesli asistanlar yararlı eklemeler olsa da, kullanıcıları anlamaya yönelik teknoloji halihazırda tatmin edici bir doğruluk düzeyine ulaştı.

OpenAI'deki kargaşanın ortasındaşirket, ChatGPT'nin yakında Android ve iOS'ta kullanıcılarla sesleri aracılığıyla etkileşime girebileceğini duyurdu. Bir kullanıcı yalnızca ChatGPT ile konuşmakla kalmayacak, aynı zamanda sesli bir yanıt da alacak. Görünüşte bu harika bir şey olsa da, yıllardır çoğunlukla olgunlaşan bir teknoloji olan sesli diktenin gerçekten başarılı olmamasının bir nedeni var. Elbette, Amazon Alexa'dan Siri'ye kadar hemen hemen her büyük ekosistemin kendi sürümü var, ancak teknolojinin o kadar çok kusuru var ki ChatGPT bile onu ilginç hale getiremez.

Kimse önsözle uğraşmak istemiyor

Sadece bana cevabı ver!

Sesli asistanlarla ilgili en büyük sıkıntılarımdan biri hem konuşmayı başlatmanın hem de cevabı almanın giriş kısmıyla uğraşmak. Çoğu zaman kendim daha hızlı bakabiliyorum ve ellerimin dolu olduğu zamanlarda, bu tür asistanlardan bulduğum en iyi kullanım, mesajlara yanıt vermek veya Google'da sorulara yanıt vermek değil, zamanlayıcıları ayarlamaktır. OpenAI kısa süre önce ChatGPT ile yapabileceğiniz bir görüşme örneğini paylaştı.

Teknik olarak etkileyici olmasına rağmen gösteri biraz saçma. Öncelikle kaç tane 16 inçlik pizza sipariş edileceği sorusu saçma. Bunun ChatGPT'nin karmaşık konuşmalarla başa çıkma yeteneğini göstermek için orada olduğunu anlıyorum, ancak yanıtın gereksiz derecede karmaşık olmasının yanı sıra sunumu da öyle. Eğer bir yapay zekaya matematiksel bir soru soruyorsam, sadece cevabını istiyorum. Önce bana numarayı söyle, sonra açıkla. Açıklamayı umursamıyorsam oynatmayı iptal edebilirim.

Ancak bunu değiştirmek yeterli değil çünkü bu, yapay zekanın yapabileceği bir şey. çoktan Yapmak. Belki de pizza dilimlerinin ve kişi sayısının bağlamsal doğası yapay zekanın bunu yapmasını gerektiriyor. "araştırma" ama bir noktada bunun gibi özelliklerin diğer tüm yapay zeka sesli asistanlarına da geleceğinden eminim. fazla. Bir kez gerçekleştiğinde, en başa dönüyoruz. en iyi Amazon Echo cihazlar OpenAI'nin büyük bir hızla ilerlediği şeyi yapabilir.

Akıllı telefonumu kullanıyorsam, bir şeyi hızlı bir şekilde yazıp aramak benim için kolaydır. Bunu her yerde, duyulmadan yapabilirim ve boş zamanımda cevapları okuyabilirim. Bir ses asistanından benim için bir şey bulmasını istersem, muhtemelen başka hangi seçeneklerin olduğunu görmek için onu kendim ararım. Sesli asistanlar çok gevezedir ve her zaman da öyle olacaktır.

Gizlilik iki açıdan da endişe verici

Kimse sorularımın ne kadar aptalca olduğunu duymak istemez

Sesli asistanın nihai hedefi nedir? Birkaç temel nedenden dolayı asla akıllı telefonların yerini almayacaklar (Humane gibi şirketlerin istediği kadar), en önemlisi gizlilik. Hizmetlere giriş yapmak, özel mesajlar göndermek ve hatta gizli modu kullandığınız o aptalca soruları Google'da aramak, ses tabanlı bir cihazla özel olarak yapmak gerçekten mümkün değildir.

Sonuç olarak, çok niş, özel kullanım bağlamları dışında, sesli asistanlar hiçbir zaman bir akıllı telefonun veya özel olarak kullanılan bir cihazın yerini tutamaz ve bunun değişeceğini de düşünmüyorum. İnsanların kendi mahremiyetlerine bakış açıları ve yüksek sesle ne söylemek istedikleri konusunda köklü bir değişiklik olmadan, insanları bu konuda ikna etmek zordur. istek cihazlarını çalıştırmak için her zaman seslerini kullanmaları.

Aynı haberin 15 farklı yerde okunmasına veya bir kişinin 778 kişi için kaç tane 16 inçlik pizzaya ihtiyacı olduğunu defalarca sormasına ihtiyacımız yok.

Kalabalık bir metroda herkesin telefonlarını kullanmak yerine sesle çalışan bir cihaz kullandığı bir dünya hayal edin. Yüksek sesle bahsetmeye bile gerek yok, bunun ne kadar telaşlı olacağını hayal edin. Kendi cihazlarınız sesleri ayırt etmekte zorluk çeker ve tıka basa dolu bir metro teorik olarak bir gürültü kakofonisi olur. Metro yeterince kötü. Aynı haberin 15 farklı yerde okunmasına veya bir kişinin 778 kişi için kaç tane 16 inçlik pizzaya ihtiyacı olduğunu defalarca sormasına gerek yok.

İnsanları, cihazlarınızın sizi 7/24 dinlemediğine ikna etmek de yeterince zor, ancak insanlar zaten yanlarında her zaman dinleyen mikrofonların bulunması konusunda tedirginler. Yalnızca sesle çalıştırılabilen cihazlarla bu zor olacak Olumsuz her zaman dinlenildiğini hissetmek.

Yalnızca ses kullanan cihazlar hiçbir zaman gerçeğe dönüşmeyecek bir hayaldir

Ve bunda sorun yok

Kaynak: İnsancıl

Ben bir teknoloji tutkunuyum, ancak cihazların uzun bir süre yalnızca sesle çalıştırılmayacak olmasının en iyisi olduğunu düşünüyorum. Burada özetlenen nedenlerden dolayı durumun böyle olması neredeyse imkansızdır. Humane gibi şirketler sınırları zorlarken, ana çalıştırma yöntemi olarak sese dayanan bir cihazla makul bir pazarı yakalamakta sonuçta başarısız olacaklar.

Sesli asistanlar, günlük olarak kullandığımız cihazlara her zaman faydalı bir katkı olacaktır, ancak bizi anlayacak teknoloji uzun zamandır yeterince iyi durumda.