ב-Google I/O 2019, גוגל חשפה את מאמציה לנגישות כגון Live Caption ב-Android Q, Live Relay ו- Live Transcribe. תמשיך לקרוא!
עדכון 1 (5/10/19 @ 23:53 ET): לפי VentureBeat, כיתוב חי לא יהיה זמין בכל המכשירים שבהם פועל Android Q. פרטים נוספים בהמשך.
לעתים קרובות אנו כצרכנים לוקחים את העולם סביבנו כמובן מאליו. מה שאנו חווים, אנו מניחים שאותו הדבר נחווה על ידי כל הסובבים אותנו במובן דומה, אם לא אותו הדבר. הנחה זו ממשיכה להתרחב לכל חלק בחיינו, כולל טכנולוגיה. אבל מוגבלויות הן אמיתיות, והחיים איתם הופכים למשימה מאתגרת בגלל הנחות אלו. נגישות הופכת אפוא לנושא חשוב, וגוגל עושה את חלקה כדי להבטיח שלאנשים עם מוגבלויות תהיה הזדמנות שווה ליהנות מחוויות אלו. אנדרואיד Q משלב כמה ממאמצי הנגישות של גוגל כדי להפוך את אנדרואיד לחוויה הרבה יותר מגובשת, אם כי לא כל התכונות המוזכרות להלן זמינות באנדרואיד כרגע.
כיתוב חי
רבים מאיתנו אף פעם לא טורחים להעיף מבט שני בהגדרות הכתוביות, ואנחנו גם צורכים הרבה מדיה מבלי לשים לב אפילו להיעדר כתוביות. אבל עבור 466 מיליון אנשים ברחבי העולם שהם חירשים וכבדי שמיעה, כיתובים משרתים מטרה גדולה יותר מנוחות - הם המדיום של החוויה.
אנדרואיד Q משלב כתוביות חיים, המאפשר למשתמשים מקהילת החירשים לגשת לחוויות בקלות ובאוניברסליות הרבה יותר.לאחר הפעלת ההגדרה, Live Caption יכתוב אוטומטית מדיה שמנגנת אודיו במכשיר שלך בלחיצה אחת. כיתוב חי עובד עם סרטונים, פודקאסטים, הודעות אודיו וכל אפליקציה אחרת - אפילו עם דברים שמוקלטים במכשיר. כתוביות יופיעו ברגע שיזהה דיבור שמתנגן במכשיר. ומכיוון שכל זה קורה באמצעות זיהוי דיבור במכשיר, לא האודיו ולא הכיתובים עוזבים את הטלפון שלך, ואתה יכול להשתמש בתכונה ללא צורך ב-WiFi או נתונים סלולריים.
עדכון 5/10/19: גוגל אישרה עם VentureBeat ש-Live Caption "יגיע לטלפונים נבחרים עם אנדרואיד Q בהמשך השנה". באופן ספציפי, "מכשירים נבחרים ומתקדמים יותר", לפי בריאן קמלר, מנהל מוצר נגישות אנדרואיד. הסיבה היא ככל הנראה בגלל אילוצי זיכרון ומקום. ההשקה הראשונית תהיה מוגבלת אך תתרחב עם הזמן, וגוגל מתכננת לשחרר רשימה של מכשירים שיקבלו תמיכה ב-Live Caption כאשר נתקרב לגרסה הפומבית הראשונה של Android Q.
יתרה מזאת, גוגל אישרה כי שמירת תמלול לא תתאפשר עם כתוביות חיות (בשל הגבלה מכוונת בתצורת AudioPlaybackCaptureConfiguration API), שהוא לא יעבוד עם שיחות טלפון, שיחות קוליות או שיחות וידאו (מכיוון שהוא לא נתמך על ידי ה-API), ושהוא יתמוך רק בכתוביות באנגלית ב- לְהַשִׁיק. לאחר השקת התכונה, יורד דגם לא מקוון, ועדכונים לדגם יוגשו דרך שירותי Google Play.
ממסר חי
Live Relay מתבסס על הרעיונות שהועלו על ידי Live Caption בכך שהוא מאפשר לאנשים לבצע ולקבל שיחות טלפון מבלי לדבר או לשמוע.
Live Relay משתמש בזיהוי דיבור במכשיר ובהמרת טקסט לדיבור כדי לאפשר לטלפון להאזין לשיחת שמע ולאחר מכן להשמיע תגובות בשם המשתמש שמקליד את התגובות. התכונה פועלת במקביל לתכונות של הצעות כתיבה חזויות כגון כתיבה חכמה ו תשובה חכמה, מה שמקל על ניהול שיחה חיה על ידי סיוע בתגובות מהירות. Live Relay פועל כולו במכשיר, כך שהשיחות עדיין פרטיות. מכיוון ש-Live Relay מתקשר עם הצד השני באמצעות שיחת טלפון רגילה, הוא יכול לעבוד גם עם קווים בצד השני.
בעוד ש- Live Relay בהחלט יועיל לקהילת החירשים ולקהילת האילם, מקרי השימוש בו מתרחבים עד מצבים שבהם מישהו אולי לא יוכל לדבר או לשמוע שיחת טלפון באותו רגע, אבל עדיין רוצה ליצור אינטראקציה עם זה. גוגל גם אופטימית לגבי שילוב יכולת תרגום בזמן אמת בתוך Live Relay, שבתורה יש פוטנציאל לאפשר לכל אחד להתקשר לכל אחד אחר בעולם ולתקשר ללא קשר למחסומי שפה.
גוגל מצהירה כי Live Relay עדיין בשלב המחקר. לא ברור מיד אם התכונה שולבה במבני Android Q הנוכחיים - אנו מנחשים שהיא תעשה את דרכה למכשירי אנדרואיד בעתיד.
תמלול חי -- הרחבה למשתמשים עם ליקויי דיבור
תמלול חי הוצג על ידי Google מוקדם יותר השנה ככלי למשתמשים חירשים להיעזר בתמלול חי של דיבור סביבם. האפליקציה נועדה להפוך שיחות יומיומיות לנגישות יותר על ידי המרת דיבור בעולם האמיתי דרך המיקרופון של הטלפון לכיתובים בזמן אמת. תמלול חי הוא כבר זמין כגרסת ביטא מוגבלת לגישה מוקדמת דרך חנות Play, עם תמיכה בלמעלה מ-70 שפות ודיאלקטים. האפליקציה מותקנת מראש גם במכשירי Pixel 3.
מחיר: חינם.
3.8.
המאמצים האחרונים של גוגל בשיפור הנגישות מרחיבים את התמלול החי לא רק למשתמשים חירשים אלא גם למשתמשים שיש להם ליקויי דיבור באמצעות Project Euphonia.
הצוות תחת Project Euphonia משתמש בבינה מלאכותית כדי לשפר את היכולת של מחשב להבין דפוסי דיבור מגוונים, כולל דיבור לקוי. גוגל שיתפה פעולה עם ארגונים ללא מטרות רווח כגון ALS Therapy Development Institute ו-ALS Residence Initiative כדי להקליט את קולם של אנשים מושפע מ-ALS, ולאחר מכן השתמש בהקלטות האלה כדי לאמן מודלים של AI לתמלל בצורה מהימנה יותר מילים שנאמרו על ידי אנשים עם דיבור מסוג זה קשיים. הסט הנוכחי של אלגוריתמי AI עובד עם השפה האנגלית כדי להתאים לאנשים שיש להם ליקויים קשור ל-ALS, אבל גוגל אופטימית לגבי יישום המחקר בקבוצות גדולות יותר ובדיבור שונה ליקויים.
יתרה מכך, גוגל גם בונה על זה על ידי אימון אלגוריתמים מותאמים אישית של AI לזיהוי צלילים ו תנועות, ולאחר מכן בצע פעולות כגון יצירת פקודות מדוברות ל-Google Home או שליחת טקסט הודעות. מקרה שימוש זה מועיל במיוחד לאנשים עם מוגבלות חמורה, שאינם יכולים לדבר ויכולים ליצור אינטראקציה רק עם צלילים שאינם דיבורים ומחוות פנים.
נראה כי הפונקציות החדשות הללו אינן זמינות עדיין בתמלול חי. גוגל מבקשת סיוע ממתנדבים שדיבור מטושטש או קשה להבנה, ואם הם מוכנים להקליט קבוצה של ביטויים כדי לעזור להמשיך ולהכשיר את המערכת לעבוד טוב יותר. אם אתה זכאי וברצונך להתנדב, בבקשה למלא את הטופס עבור אותו הדבר.
המאמצים של גוגל לשפר את הנגישות של הטכנולוגיה בהחלט ראויים לשבח. אנו מקווים שחברות תוכנה נוספות יפעלו כדי לספק לאנשים בעלי יכולת שונה חוויה שוויונית של העולם.
מקור 1: גוגלמקור 2: גוגלמקור 3: גוגל