התפעול הקולי של ChatGPT מראה שעוזרים קוליים לעולם לא יחליפו את הטלפון החכם שלך

ChatGPT הציגה הכתבה קולית, אבל יש סיבה לכך שהיא לעולם לא תמריא באמת

טייק אווי מפתח

OpenAI הודיעה לאחרונה כי ChatGPT יוכל ליצור אינטראקציה עם משתמשים באמצעות קול.
לטכנולוגיית הכתבה קולית יש פגמים שהפריעו לאימוץ הנרחב שלה. למה להתמודד עם התגובות הארוכות של העוזרות הקוליות כשאתה יכול למצוא תשובות במהירות בעצמך?
פרטיות היא גם דאגה מרכזית אצל עוזרי קול בגלל חוסר האבטחה והסיכון של מיקרופונים שמאזינים תמיד.
סביר להניח שמכשירים בלעדיים המופעלים קוליים לא יהפכו למציאות בגלל סיבות מעשיות והעדפות משתמש. בעוד שעוזרות קוליות יכולות להיות תוספות מועילות, הטכנולוגיה להבנת משתמשים כבר הגיעה לרמת דיוק מספקת.

בתוך המהומה ב-OpenAI, החברה הודיעה ש-ChatGPT תוכל בקרוב ליצור אינטראקציה עם משתמשים באמצעות הקולות שלהם באנדרואיד ו-iOS. לא רק שמשתמש יכול לדבר עם ChatGPT, אלא שהם יקבלו כעת גם תגובה קולית. למרות שזה מגניב על פני השטח, יש סיבה לכך שהכתבה הקולית, טכנולוגיה שהייתה בוגרת בעיקר כבר שנים רבות, לא ממש המריאה. בטח, כמעט לכל מערכת אקולוגית גדולה יש גרסה משלה, מאמזון אלקסה ועד סירי, אבל לטכנולוגיה יש כל כך הרבה פגמים שאפילו ChatGPT לא יכול להפוך אותו למעניין.

אף אחד לא רוצה להתמודד עם ההקדמה

רק תן לי את התשובה!

אחד המטרדים הכי גדולים שלי עם עוזרים קוליים נובע מההתמודדות עם ההקדמה של ייזום השיחה וגם קבלת התשובה. לעתים קרובות אני יכול לחפש את זה מהר יותר בעצמי, ובזמנים שבהם הידיים שלי מלאות, השימוש הטוב ביותר שאני מוצא עבור עוזרים מסוג זה הוא להגדרת טיימרים, לא להגיב להודעות או לגוגל שאלות. OpenAI שיתפה לאחרונה דוגמה לשיחה שתוכל לנהל עם ChatGPT.

אמנם טכנית מרשימה, אבל ההדגמה קצת מגוחכת. ראשית, השאלה - לגבי כמה פיצות 16 אינץ' להזמין - היא אבסורדית. אני מבין שזה שם כדי להדגים את היכולת של ChatGPT להתמודד עם שיחות מורכבות, אבל לא רק שהתשובה מורכבת מיותר, אלא גם ההגשה. אם אני שואל שאלה מתמטית של AI, אני רק רוצה את התשובה. תגיד לי תחילה את המספר, ואז תסביר אותו. אם לא אכפת לי מההסבר, אני יכול פשוט לבטל את ההשמעה.

אבל זה לא מספיק, כי זה משהו שבינה מלאכותית יכולה כְּבָר לַעֲשׂוֹת. אולי האופי ההקשרי של מספר פרוסות הפיצה ומספר האנשים מחייב את הבינה המלאכותית "מחקר", אבל בשלב מסוים, אני בטוח שתכונות כאלה יגיעו לכל שאר עוזרי ה-AI, גַם. ברגע שזה קורה, אנחנו חוזרים למקום הראשון כאשר אפילו Amazon Echo הטוב ביותר מכשירים יכולים לעשות את מה ש-OpenAI התקדמה לקראתו בקצב מסחרר.

אם אני משתמש בסמארטפון שלי, קל לי להקליד ולחפש משהו במהירות. אני יכול לעשות את זה בכל מקום, בלי שישמעו אותי, ואז אני יכול לקרוא את התשובות בנחת. אם אני מבקש מעוזרת קולית למצוא משהו בשבילי, רוב הסיכויים שאחפש אותו בעצמי לאחר מעשה כדי לראות אילו אפשרויות נוספות קיימות. העוזרות הקוליות משמיעות מדי מילים, והן תמיד יהיו.

פרטיות היא גם דאגה בשתי מישורים

אף אחד לא רוצה לשמוע כמה השאלות שלי מטופשות

מהי המטרה הסופית של עוזר קולי? הם לעולם לא יחליפו סמארטפונים (כפי שחברות כמו Humane רוצות שיעשו) מכמה סיבות מרכזיות, והחשובה ביותר היא הפרטיות. כניסה לשירותים, שליחת הודעות פרטיות או אפילו לגגל את השאלות המטופשות והמטופשות האלה שאתה משתמש עבורן במצב גלישה לא ממש אפשרי לעשות באופן פרטי עם מכשיר מבוסס קול.

כתוצאה מכך, מחוץ להקשרים מאוד נישתיים של שימוש פרטי, עוזרות קוליות לעולם לא יוכלו להחליף סמארטפון או מכשיר בשימוש פרטי, ואני לא רואה שזה משתנה אי פעם. ללא שינוי מהותי באופן שבו אנשים רואים את הפרטיות שלהם ואת מה שהם מוכנים לומר בקול רם, קשה לשכנע אנשים שהם רוצה להשתמש בקול שלהם כדי להפעיל את המכשירים שלהם כל הזמן.

אנחנו לא צריכים שאותו דיווח חדשותי ייקרא ב-15 מקומות שונים או שאדם אחד ישאל שוב ושוב על כמה פיצות 16 אינץ' הם צריכים עבור 778 אנשים.

תארו לעצמכם עולם שבו, במקום שכולם ישתמשו בטלפונים שלהם ברכבת תחתית עמוסה, הם משתמשים במכשיר המופעל באמצעות קול. תארו לעצמכם כמה קדחתני זה יהיה, שלא לומר רועש. המכשירים שלך יתקשה להבחין בקולות, ורכבת תחתית עמוסה תהיה תיאורטית קקפוניה של רעש. הרכבת התחתית גרועה מספיק. זה לא צריך לקרוא את אותו דיווח חדשותי ב-15 מקומות שונים או שאדם אחד ישאל שוב ושוב על כמה פיצות 16 אינץ' הם צריכים עבור 778 אנשים.

זה גם מספיק קשה לשכנע אנשים שהמכשירים שלך לא מקשיבים לך 24/7, אבל אנשים כבר מוטרדים מכך שיש לידם מיקרופונים שמאזינים תמיד. עם מכשירים שניתן להפעיל רק בקול, זה יהיה קשה לֹא להרגיש שמקשיבים לו כל הזמן.

מכשירים קוליים בלבד הם חלום שלעולם לא יהפוך למציאות

ואני בסדר עם זה

מקור: Humane

אני חובב טכנולוגיה, אבל אני חושב שזה לטובה שמכשירים לא יהיו מופעלים קוליים בלבד במשך זמן רב. זה כמעט בלתי אפשרי שזה יהיה המקרה מהסיבות המפורטות כאן. בעוד שחברות כמו Humane דוחפות את המעטפת, הן בסופו של דבר לא יצליחו לכבוש שום שוק סביר עם מכשיר המסתמך על קול כדרך העיקרית לתפעול.

עוזרי קול יהיו לנצח תוספת מועילה למכשירים שבהם אנו משתמשים מדי יום, אבל הטכנולוגיה כדי להבין אותנו הייתה טובה מספיק כבר הרבה זמן.