Τι είναι η Αναγνώριση ομιλίας; ορισμός & νόημα

Αναγνώριση ομιλίας είναι η αποκωδικοποίηση της ανθρώπινης ομιλίας σε μεταγραμμένο κείμενο μέσω ενός προγράμματος υπολογιστή. Για να αναγνωρίσει τις προφορικές λέξεις, το πρόγραμμα πρέπει να μεταγράψει το εισερχόμενο ηχητικό σήμα σε ψηφιοποιημένο αναπαράσταση, η οποία πρέπει στη συνέχεια να συγκριθεί με μια τεράστια βάση δεδομένων ψηφιοποιημένων αναπαραστάσεων του προφορικές λέξεις. Για να μεταγράψουν την ομιλία με οποιονδήποτε αποδεκτό βαθμό ακρίβειας, οι χρήστες πρέπει να εκφωνούν κάθε λέξη ανεξάρτητα, με μια παύση μεταξύ κάθε λέξης και αυτό επιβραδύνει σημαντικά την ταχύτητα των συστημάτων αναγνώρισης ομιλίας και θέτει υπό αμφισβήτηση τη χρησιμότητά τους, Με εξαίρεση την περίπτωση σωματικών αναπηριών που θα εμπόδιζαν την εισαγωγή από άλλους που σημαίνει. Δείτε τη διακριτή αναγνώριση ομιλίας.

Το Technipages εξηγεί την αναγνώριση ομιλίας

Η αναγνώριση ομιλίας είναι η ικανότητα ενός προκαθορισμένου λογισμικού, να ακούει μια φωνητική εντολή, να την ερμηνεύει και να δίνει μια απάντηση. Οι απαντήσεις μπορεί να κυμαίνονται από τον υπολογιστή σας που σας δίνει αποτελέσματα από μια αναζήτηση που μόλις παραγγείλατε ή ακόμα και να λάβετε απάντηση από τους βοηθούς τηλεφώνου. Για να μπορέσει οποιοσδήποτε τύπος υπολογιστή να έχει πρόσβαση σε αυτήν την τεχνολογία, πρέπει να έχει είσοδο ήχου όπως ένα μικρόφωνο για να μπορεί να δίνει εντολές στο σύστημα.


Η ανάπτυξη αυτής της τεχνολογίας ξεκίνησε τη δεκαετία του 1950, με την πρώτη να ήταν το 1952, ο κατασκευαστής ήταν Bell Laboratories, και ανέπτυξαν την Audrey, η οποία αναγνωρίζει μόνο ψηφία που διαβάζονται από μια σόλα φωνή. Η IBM παρουσίασε το Shoebox το 1962, το οποίο μπορούσε να απαντήσει σε περίπου 16 λέξεις στην αγγλική γλώσσα. Ο Alexander Waibel ανέπτυξε την άρπυια και μπορούσε να καταλάβει πάνω από χίλιες λέξεις. Η τεχνολογία χρησιμοποιεί τα μοντέλα Hidden Markov επειδή μπορούν να εκπαιδευτούν αυτόματα, αλλά και υπολογιστικά κατάλληλα για χρήση.
Η Google και η Apple είναι δύο εταιρείες που έχουν χρησιμοποιήσει την τεχνολογία της αναγνώρισης ομιλίας και της Apple Η είσοδος στη βιομηχανία αναγνώρισης ομιλίας συγκέντρωσε την προσοχή του κοινού λόγω της Τεχνητής Νοημοσύνης του υποστήριξη. Τα smartphone ήταν η βάση για τους ψηφιακούς βοηθούς.

Κοινές χρήσεις της αναγνώρισης ομιλίας

  • Αναγνώρισης ομιλίας Η τεχνολογία θα μπορούσε να αξιοποιηθεί τόσο από τον στρατιωτικό όσο και από τον ιατρικό τομέα μιας χώρας
  • Αναγνώρισης ομιλίας είναι μια ολοένα αυξανόμενη θέση, καθώς εφαρμόζεται από την Google και την Apple για να οδηγήσουν τους πελάτες στους διαφορετικούς στόχους τους
  • Το κρυφό μοντέλο Markov είναι η υποκείμενη τεχνολογία αναγνώρισης ομιλίας καθώς ο υπολογισμός του είναι κατάλληλος για χρήση

Συνήθεις κακές χρήσεις της αναγνώρισης ομιλίας

  • Υπολογιστικά συστήματα που επιθυμούν να αξιοποιήσουν το αναγνώρισης ομιλίας Το λογισμικό λειτουργιών δεν χρειάζεται απαραίτητα να έχει μικρόφωνο