מהו זיהוי דיבור? הגדרה ומשמעות

click fraud protection

זיהוי דיבור הוא פענוח של דיבור אנושי לטקסט מתומלל באמצעות תוכנת מחשב. כדי לזהות מילים מדוברות, התוכנית חייבת לתמלל את אות הצליל הנכנס לתוך דיגיטאלי ייצוג, שאותו יש להשוות למסד נתונים עצום של ייצוגים דיגיטאליים של מילים מדוברות. כדי לתמלל דיבור בכל מידה נסבלת של דיוק, המשתמשים חייבים לדבר כל מילה באופן עצמאי, עם הפסקה בין כל מילה וזה מאט באופן משמעותי את מהירות מערכות זיהוי דיבור ומעמידה בספק את התועלת שלהן, למעט במקרה של מוגבלויות פיזיות שימנעו קלט של אחרים אומר. ראה זיהוי דיבור דיסקרטי.

Technipages מסביר על זיהוי דיבור

זיהוי דיבור הוא היכולת של תוכנה מוגדרת מראש, להאזין לפקודה קולית, לפרש אותה ולתת תגובה. התגובות יכולות לנוע בין שהמחשב שלך נותן לך תוצאות מחיפוש שזה עתה הזמנת, או אפילו קבלת תגובה מעוזרות טלפוניות. לפני שכל סוג של מחשב יוכל לגשת לטכנולוגיה הזו, חייב להיות לו קלט קול כמו מיקרופון כדי להיות מסוגל לתת פקודות למערכת.
פיתוח טכנולוגיה זו החל בשנות ה-50, כשהראשון היה ב-1952, היזם היה מעבדות בל, והם פיתחו את אודרי, שמזהה רק ספרות הנקראות על ידי סוליה קוֹל. IBM הציגה את Shoebox ב-1962, שיכולה להגיב לכ-16 מילים בשפה האנגלית. אלכסנדר וייבל פיתח הארפיה, והיא הצליחה להבין יותר מאלף מילים. הטכנולוגיה משתמשת בדגמי Hidden Markov מכיוון שניתן לאמן אותם באופן אוטומטי, גם מתאימים לשימוש חישובי.


גוגל ואפל הן שתי חברות שהשתמשו בטכנולוגיה של זיהוי דיבור ושל אפל הכניסה לתעשיית זיהוי הדיבור זכתה לתשומת לב ציבורית בשל הבינה המלאכותית שלה גיבוי. סמארטפונים היו הבסיס לעוזרים דיגיטליים.

שימושים נפוצים בזיהוי דיבור

  • זיהוי דיבור ניתן לרתום את הטכנולוגיה הן על ידי המגזר הצבאי והן על ידי המגזר הרפואי של מדינה
  • זיהוי דיבור היא נישה שהולכת וגדלה כשהיא מיושמת על ידי גוגל ואפל כדי להניע לקוחות למטרותיהם השונות
  • מודל מרקוב הנסתר הוא הטכנולוגיה הבסיסית עבור זיהוי דיבור שכן החישוב שלו מתאים לשימוש

שימוש לרעה נפוצ בזיהוי דיבור

  • מערכות מחשב המעוניינות להשתמש ב זיהוי דיבור תוכנת פונקציות לא בהכרח צריכה להיות בעלת מיקרופון