Η φωνητική λειτουργία του ChatGPT δείχνει ότι οι βοηθοί φωνής δεν θα αντικαταστήσουν ποτέ το smartphone σας

Το ChatGPT εισήγαγε τη φωνητική υπαγόρευση, αλλά υπάρχει ένας λόγος που δεν θα απογειωθεί ποτέ πραγματικά

Βασικά Takeaways

Το OpenAI ανακοίνωσε πρόσφατα ότι το ChatGPT θα μπορεί να αλληλεπιδρά με τους χρήστες μέσω φωνής.
Η τεχνολογία φωνητικής υπαγόρευσης έχει ελαττώματα που εμπόδισαν την ευρεία υιοθέτησή της. Γιατί να ασχοληθείτε με τις μακροσκελείς απαντήσεις των φωνητικών βοηθών όταν μπορείτε να βρείτε γρήγορα απαντήσεις μόνοι σας;
Το απόρρητο αποτελεί επίσης σημαντικό πρόβλημα με τους φωνητικούς βοηθούς λόγω της έλλειψης ασφάλειας και του κινδύνου των μικροφώνων που ακούνε πάντα.
Οι αποκλειστικές συσκευές που λειτουργούν με φωνή είναι απίθανο να γίνουν πραγματικότητα για πρακτικούς λόγους και τις προτιμήσεις των χρηστών. Ενώ οι βοηθοί φωνής μπορούν να είναι χρήσιμες προσθήκες, η τεχνολογία για την κατανόηση των χρηστών έχει ήδη φτάσει σε ένα ικανοποιητικό επίπεδο ακρίβειας.

Εν μέσω αναταραχής στο OpenAI, η εταιρεία ανακοίνωσε ότι το ChatGPT θα μπορεί σύντομα να αλληλεπιδρά με τους χρήστες μέσω της φωνής τους σε Android και iOS. Όχι μόνο ένας χρήστης μπορεί να μιλήσει στο ChatGPT, αλλά θα λάβει τώρα και μια ηχητική απάντηση. Αν και αυτό είναι ωραίο στην επιφάνεια, υπάρχει λόγος που η φωνητική υπαγόρευση, μια τεχνολογία που είναι ως επί το πλείστον ώριμη εδώ και πολλά χρόνια τώρα, δεν έχει πραγματικά απογειωθεί. Σίγουρα, σχεδόν κάθε σημαντικό οικοσύστημα έχει τη δική του έκδοση, από το Amazon Alexa μέχρι το Siri, αλλά η τεχνολογία έχει τόσα πολλά ελαττώματα που ούτε το ChatGPT δεν μπορεί να το κάνει ενδιαφέρον.

Κανείς δεν θέλει να ασχοληθεί με το προοίμιο

Απλά δώσε μου την απάντηση!

Μία από τις μεγαλύτερες ενόχλησή μου με τους βοηθούς φωνής προέρχεται από την αντιμετώπιση του προοίμιου τόσο της έναρξης της συνομιλίας όσο και της λήψης της απάντησης. Συχνά μπορώ να το ψάξω πιο γρήγορα και σε περιόδους που τα χέρια μου είναι γεμάτα, η καλύτερη χρήση που βρίσκω για τέτοιου είδους βοηθούς είναι να ρυθμίζω χρονόμετρα, να μην απαντώ σε μηνύματα ή να γκουγκλάρω ερωτήσεις. Το OpenAI μοιράστηκε πρόσφατα ένα παράδειγμα μιας συνομιλίας που θα μπορούσατε να έχετε με το ChatGPT.

Αν και τεχνικά εντυπωσιακή, η επίδειξη είναι λίγο γελοία. Πρώτα απ 'όλα, το ερώτημα - για το πόσες πίτσες 16 ιντσών να παραγγείλετε - είναι παράλογο. Κατανοώ ότι υπάρχει για να δείξει την ικανότητα του ChatGPT να αντιμετωπίζει περίπλοκες συνομιλίες, αλλά όχι μόνο η απάντηση είναι άσκοπα πολύπλοκη, αλλά και η παράδοση. Αν κάνω μια μαθηματική ερώτηση ενός AI, θέλω απλώς την απάντηση. Πες μου πρώτα τον αριθμό και μετά εξήγησέ το. Αν δεν με ενδιαφέρει η εξήγηση, μπορώ απλώς να ακυρώσω την αναπαραγωγή.

Ωστόσο, δεν αρκεί να το αλλάξετε, γιατί αυτό μπορεί να το κάνει η τεχνητή νοημοσύνη ήδη κάνω. Ίσως η συμφραζόμενη φύση του αριθμού των φετών πίτσας και του αριθμού των ατόμων να απαιτεί από την τεχνητή νοημοσύνη "έρευνα", αλλά κάποια στιγμή, είμαι σίγουρος ότι τέτοια χαρακτηριστικά θα έρθουν σε όλους τους άλλους βοηθούς φωνής AI, πολύ. Μόλις το κάνει, είμαστε πίσω στο πρώτο όταν ακόμη και το καλύτερο Amazon Echo οι συσκευές μπορούν να κάνουν αυτό προς το οποίο κινείται το OpenAI με ιλιγγιώδεις ρυθμούς.

Εάν χρησιμοποιώ το smartphone μου, είναι εύκολο για μένα να πληκτρολογήσω γρήγορα και να αναζητήσω κάτι. Μπορώ να το κάνω αυτό οπουδήποτε, χωρίς να με ακούνε, και μετά μπορώ να διαβάσω τις απαντήσεις με τον ελεύθερο χρόνο μου. Αν ζητήσω από έναν φωνητικό βοηθό να βρει κάτι για μένα, το πιθανότερο είναι να το ψάξω μόνος μου εκ των υστέρων για να δω τι άλλες επιλογές υπάρχουν. Οι βοηθοί φωνής είναι πολύ λογικοί, και πάντα θα είναι.

Το απόρρητο είναι επίσης ανησυχητικό, σε δύο μέτωπα

Κανείς δεν θέλει να ακούσει πόσο ανόητες είναι οι ερωτήσεις μου

Ποιος είναι ο τελικός στόχος ενός φωνητικού βοηθού; Δεν πρόκειται ποτέ να αντικαταστήσουν τα smartphone (όσο τα θέλουν εταιρείες όπως η Humane) για πολλούς βασικούς λόγους, ο πιο σημαντικός είναι το απόρρητο. Η σύνδεση σε υπηρεσίες, η αποστολή προσωπικών μηνυμάτων ή ακόμα και η γκουγκλάρισμα αυτών των ανόητων, χαζών ερωτήσεων για τις οποίες χρησιμοποιείτε την κατάσταση ανώνυμης περιήγησης δεν είναι πραγματικά δυνατό να γίνει ιδιωτικά με μια συσκευή που βασίζεται στη φωνή.

Ως αποτέλεσμα, έξω από πολύ εξειδικευμένα περιβάλλοντα ιδιωτικής χρήσης, οι βοηθοί φωνής δεν μπορούν ποτέ να αντικαταστήσουν ένα smartphone ή μια ιδιωτική συσκευή και δεν βλέπω ότι αυτό αλλάζει ποτέ. Χωρίς μια θεμελιώδη αλλαγή στον τρόπο με τον οποίο οι άνθρωποι βλέπουν το απόρρητό τους και τι είναι πρόθυμοι να πουν δυνατά, είναι δύσκολο να πειστούν οι άνθρωποι ότι θέλω να χρησιμοποιούν τη φωνή τους για να χειρίζονται τις συσκευές τους όλη την ώρα.

Δεν χρειαζόμαστε να διαβάζεται η ίδια αναφορά ειδήσεων σε 15 διαφορετικά μέρη ή ένα άτομο να ρωτά επανειλημμένα πόσες πίτσες 16 ιντσών χρειάζονται για 778 άτομα.

Φανταστείτε έναν κόσμο όπου, αντί να χρησιμοποιούν όλοι τα τηλέφωνά τους σε ένα γεμάτο μετρό, χρησιμοποιούν μια συσκευή που λειτουργεί με φωνή. Φανταστείτε πόσο ταραχώδες θα γινόταν, για να μην πω δυνατά. Οι δικές σας συσκευές θα είχαν πρόβλημα να διακρίνουν τις φωνές και ένα γεμάτο μετρό θα ήταν θεωρητικά μια κακοφωνία θορύβου. Το μετρό είναι αρκετά κακό. Δεν χρειάζεται να διαβάζεται το ίδιο ρεπορτάζ ειδήσεων σε 15 διαφορετικά μέρη ή ένα άτομο να ρωτά επανειλημμένα πόσες πίτσες 16 ιντσών χρειάζονται για 778 άτομα.

Είναι επίσης αρκετά δύσκολο να πείσεις τους ανθρώπους, καθώς είναι ότι οι συσκευές σου δεν σε ακούν 24 ώρες το 24ωρο, 7 ώρες το 24ωρο, αλλά οι άνθρωποι είναι ήδη ανυπόμονοι να έχουν κοντά τους μικρόφωνα που ακούνε πάντα. Με συσκευές που μπορούν να λειτουργούν μόνο με φωνή, θα είναι δύσκολο δεν να νιώθεις ότι ακούγεται ανά πάσα στιγμή.

Οι συσκευές που χρησιμοποιούν μόνο φωνή είναι ένα όνειρο που δεν θα γίνει ποτέ πραγματικότητα

Και είμαι εντάξει με αυτό

Πηγή: Humane

Είμαι λάτρης της τεχνολογίας, αλλά πιστεύω ότι είναι καλό που οι συσκευές δεν πρόκειται να λειτουργούν αποκλειστικά με φωνή για μεγάλο χρονικό διάστημα. Είναι σχεδόν αδύνατο να συμβεί αυτό για τους λόγους που περιγράφονται εδώ. Ενώ εταιρείες όπως η Humane πιέζουν το φάκελο, τελικά θα αποτύχουν να κατακτήσουν οποιαδήποτε λογική αγορά με μια συσκευή που βασίζεται στη φωνή ως τον κύριο τρόπο λειτουργίας της.

Οι βοηθοί φωνής θα είναι για πάντα μια χρήσιμη προσθήκη στις συσκευές που χρησιμοποιούμε καθημερινά, αλλά η τεχνολογία που μας καταλαβαίνει είναι αρκετά καλή εδώ και πολύ καιρό.