Η Google παρουσίασε δύο νέα API στο ML Kit: Entity Extraction και Selfie Segmentation. Διαβάστε παρακάτω για να μάθετε περισσότερα για αυτούς!
Πριν από μερικά χρόνια, η Google παρουσίασε το ML Kit για να διευκολύνουν τους προγραμματιστές να εφαρμόσουν μηχανική εκμάθηση στις εφαρμογές τους. Από τότε, έχουμε δει API για Αναγνώριση ψηφιακής μελάνης, Μετάφραση στη συσκευή και Ανίχνευση προσώπου. Τώρα, η Google προσθέτει ένα νέο Entity Extraction στο ML Kit μαζί με μια νέα δυνατότητα Selfie Segmentation.
είπε η Google το νέο Entity Extraction API θα επιτρέπει στους προγραμματιστές να εντοπίζουν και να εντοπίζουν οντότητες από μη επεξεργασμένο κείμενο και να αναλαμβάνουν δράση με βάση αυτές τις οντότητες.
«Το API λειτουργεί σε στατικό κείμενο και επίσης σε πραγματικό χρόνο ενώ ένας χρήστης πληκτρολογεί», είπε η Google. "Υποστηρίζει 11 διαφορετικές οντότητες και 15 διαφορετικές γλώσσες (με περισσότερες στο μέλλον) για να επιτρέψει στους προγραμματιστές να κάνουν οποιαδήποτε αλληλεπίδραση κειμένου μια πιο πλούσια εμπειρία για τον χρήστη."
Ακολουθούν οι οντότητες που υποστηρίζονται:
- Διεύθυνση(350 τρίτη οδός, Κέιμπριτζ)
- Ημερομηνία ώρα*(12/12/2020, αύριο στις 3 μ.μ.) (ας βρεθούμε αύριο στις 6 μ.μ.)
- ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ([email protected])
- Αριθμός πτήσης*(LX37)
- IBAN*(CH52 0483 0000 0000 0000 9)
- ISBN*(978-1101904190)
- Χρήματα (συμπεριλαμβανομένου νομίσματος)*(12 $, 25 USD)
- Κάρτα πληρωμής*(4111 1111 1111 1111)
- Τηλεφωνικό νούμερο((555) 225-3556, 12345)
- Αριθμός εντοπισμού*(1Z204E380338943508)
- URL(www.google.com, https://en.wikipedia.org/wiki/Platypus, seznam.cz)
Η Google είπε ότι δοκιμάζει το Entity Extraction API με το TamTam για να επιτρέψει στην εφαρμογή να παρέχει χρήσιμες προτάσεις στους χρήστες κατά τη διάρκεια των συνομιλιών συνομιλίας. Όταν μια διεύθυνση εμφανίζεται στην οθόνη, για παράδειγμα, κάνοντας κλικ σε αυτήν θα εμφανιστεί ένα μενού για να αντιγράψετε τη διεύθυνση, να ανοίξετε με άλλη εφαρμογή ή να λάβετε οδηγίες για την τοποθεσία.
Οι σχολιαστές/μοντέλα νευρωνικών δικτύων στο Entity Extraction API λειτουργούν ως εξής: Ένα δεδομένο κείμενο εισόδου αρχικά χωρίζεται σε λέξεις (με βάση τον διαχωρισμό του χώρου) και στη συνέχεια όλες οι πιθανές υποακολουθίες λέξεων του δημιουργείται συγκεκριμένο μέγιστο μήκος (15 λέξεις στο παραπάνω παράδειγμα) και για κάθε υποψήφιο το νευρωνικό δίκτυο βαθμολόγησης εκχωρεί μια τιμή (μεταξύ 0 και 1) με βάση το αν αντιπροσωπεύει μια έγκυρη οντότητα.
Στη συνέχεια, οι δημιουργούμενες οντότητες που επικαλύπτονται αφαιρούνται, ευνοώντας αυτές με υψηλότερη βαθμολογία έναντι των αντικρουόμενων με χαμηλότερη βαθμολογία. Στη συνέχεια, ένα δεύτερο νευρωνικό δίκτυο χρησιμοποιείται για να ταξινομήσει τον τύπο της οντότητας ως αριθμό τηλεφώνου, διεύθυνση ή σε ορισμένες περιπτώσεις, μη οντότητα.
Η Google είπε ότι το Entity Extraction API του ML Kit βασίζεται στην τεχνολογία που ενίσχυσε τη λειτουργία Smart Linkify που παρουσιάστηκε με το Android 10.
Εκτός από το Entity Extraction που βασίζεται σε κείμενο, η Google ανακοίνωσε επίσης ένα νέο Selfie Segmentation API. Η δυνατότητα θα επιτρέψει στους προγραμματιστές να διαχωρίσουν το φόντο από μια σκηνή. Αυτό θα επιτρέψει στους χρήστες να προσθέτουν δροσερά εφέ στις selfies ή ακόμα και να εισάγονται σε ένα καλύτερο φόντο. Η Google είπε ότι το νέο API είναι ικανό να παράγει εξαιρετικά αποτελέσματα με χαμηλό λανθάνοντα χρόνο τόσο σε Android όσο και σε iOS.
Το ML Kit SDK ενσωματώνει χρόνια δουλειάς της Google στη μηχανική εκμάθηση σε ένα πακέτο Firebase που μπορούν να χρησιμοποιήσουν οι προγραμματιστές εφαρμογών για κινητά για να βελτιώσουν τις εφαρμογές τους. Από τότε που κυκλοφόρησε το ML Kit, έχουν αποκαλυφθεί πολλά API που κάνουν την εφαρμογή λειτουργιών που υποστηρίζονται από μηχανική μάθηση σε εφαρμογές πολύ πιο εύκολη για τους προγραμματιστές. Με την Εξαγωγή οντοτήτων και την Τμηματοποίηση Selfie, οι εφαρμογές του μέλλοντος θα γίνουν ακόμα καλύτερες.