Το ML Kit της Google είναι ένα νέο Firebase SDK που εξαλείφει τον πονοκέφαλο από τη μηχανική εκμάθηση

Ενδιαφέρεστε για μηχανική εκμάθηση αλλά δεν έχετε μεγάλη εμπειρία; Το νέο ML Kit SDK της Google διευκολύνει την ενσωμάτωση της μηχανικής εκμάθησης στην εφαρμογή Android ή iOS.

Η μηχανική μάθηση και η τεχνητή νοημοσύνη έχουν εισέλθει γρήγορα στο λεξικό μας τα τελευταία χρόνια, αλλά λίγοι καταλαβαίνουν πραγματικά πώς λειτουργεί η τεχνολογία ή τι είναι ικανοί να κάνουν. Ακόμη και οι ερευνητές τεχνητής νοημοσύνης της Google αστειεύεται ότι η μηχανική μάθηση είναι παρόμοια με την αλχημεία. Ως πολυάσχολος προγραμματιστής, μπορεί να μην έχετε το χρόνο να μάθετε για τη μηχανική εκμάθηση (ML), αλλά η Google δεν θέλει αυτό να σας εμποδίσει να αποκομίσετε τα οφέλη της. Για το λόγο αυτό, η εταιρεία ανακοίνωσε σήμερα Κιτ ML: Ένα νέο SDK που ενσωματώνει χρόνια εργασίας της Google στη μηχανική εκμάθηση σε ένα πακέτο Firebase που χρησιμοποιούν οι προγραμματιστές εφαρμογών για κινητά τόσο iOS όσο και Android μπορούν να χρησιμοποιήσουν για να βελτιώσουν τις εφαρμογές τους.

Αν εσύ δεν ξέρω τίποτα για τη μηχανική μάθηση

, τότε μην ανησυχείς: Δεν χρειάζεστε προηγούμενες γνώσεις ML. Πιθανότατα είστε εξοικειωμένοι με ορισμένες πραγματικές εφαρμογές της τεχνολογίας, όπως η ανίχνευση προσώπου και η αναγνώριση εικόνας. Το κιτ ML της Google θέλει η εφαρμογή σας να επωφελείται από τις πραγματικές χρήσεις της ML χωρίς να χρειάζεται να κατανοήσετε πώς λειτουργεί ο αλγόριθμος. Και αν καταλαβαίνετε ML ή είστε πρόθυμοι να μάθετε, μπορείτε επίσης να επωφεληθείτε από το ML Kit.


Μηχανική εκμάθηση για αρχάριους με το ML Kit

Το νέο Firebase SDK της Google για ML προσφέρει πέντε API για ορισμένες από τις πιο συνηθισμένες περιπτώσεις χρήσης σε κινητά:

  • Αναγνώριση κειμένου
  • Ανίχνευση προσώπου
  • Σάρωση γραμμωτού κώδικα
  • Επισήμανση εικόνας
  • Αναγνώριση ορόσημων

Το μόνο που χρειάζεται να κάνετε είναι να περάσετε δεδομένα στο API και το SDK επιστρέφει μια απάντηση. Είναι τόσο απλό. Μερικά παραδείγματα χρήσης ML περιλαμβάνουν εφαρμογές μουσικής που ερμηνεύουν ποιες νότες παίζετε και εφαρμόζουν ακύρωση ηχούς/θορύβου στη μουσική σας. Ένα άλλο παράδειγμα θα μπορούσε να είναι η οπτική αναγνώριση χαρακτήρων (OCR) για διατροφικές ετικέτες για εφαρμογές μέτρησης θερμίδων.

Η λίστα των διαθέσιμων βασικών API θα επεκταθεί τους επόμενους μήνες για να περιλαμβάνει ένα API έξυπνης απάντησης όπως ακριβώς Android P και μια προσθήκη περιγράμματος προσώπου υψηλής πυκνότητας στο API ανίχνευσης προσώπου.


Κιτ ML για έμπειρους χρήστες

Εάν έχετε κάποιες προηγούμενες γνώσεις, τότε μπορείτε επίσης να αναπτύξετε το δικό σας έθιμο TensorFlow Lite μοντέλα. Το μόνο που έχετε να κάνετε είναι να ανεβάσετε το μοντέλο σας στην κονσόλα Firebase, ώστε να μην ανησυχείτε για τη ομαδοποίηση του μοντέλου στο APK (μειώνοντας έτσι το μέγεθος του αρχείου.) Το ML Kit εξυπηρετεί το μοντέλο σας δυναμικά, ώστε να μπορείτε να ενημερώσετε τα μοντέλα σας χωρίς να δημοσιεύσετε εκ νέου το εφαρμογή.

Ακόμα καλύτερο είναι ότι η Google θα συμπιέζει αυτόματα τα πλήρη μοντέλα TensorFlow σε ένα TensorFlow Lite μοντέλο, το οποίο μειώνει το μέγεθος του αρχείου και διασφαλίζει ότι περισσότερα άτομα με περιορισμένες συνδέσεις δεδομένων μπορούν να απολαύσουν το δικό σας εφαρμογή.


API στη συσκευή και στο Cloud

Το ML Kit προσφέρει API τόσο στη συσκευή όσο και στο Cloud. Το API της συσκευής επεξεργάζεται δεδομένα χωρίς σύνδεση δικτύου (όπως Η δυνατότητα επιλογής κειμένου του Android Oreo) ενώ τα API Cloud χρησιμοποιούν την πλατφόρμα Google Cloud για την επεξεργασία δεδομένων για μεγαλύτερη ακρίβεια.

Το ML Kit λειτουργεί τόσο σε Android όσο και σε iOS, και συγκεκριμένα σε Android, λειτουργεί με συσκευές με εκδόσεις Android τόσο παλιές όσο το Ice Cream Sandwich. Εάν ο χρήστης εκτελείται Android 8.1 Oreo και παραπάνω, τότε το ML Kit θα προσφέρει καλύτερη απόδοση χάρη στο Neural Networks API που είναι ήδη παρόν. Σε συσκευές με chipset που διαθέτουν εξειδικευμένο υλικό όπως το Qualcomm Snapdragon 845 (και το εξάγωνο DSP του) ή το HiSilicon Kirin 970 (και της Μονάδας Νευρωνικής Επεξεργασίας), η επεξεργασία στη συσκευή θα επιταχυνθεί. Η Google λέει ότι συνεργάζεται με προμηθευτές SoC για τη βελτίωση της αναγνώρισης στη συσκευή.


συμπέρασμα

Οι προγραμματιστές που θέλουν να ξεκινήσουν θα πρέπει να αναζητήσουν το νέο SDK στο Κονσόλα Firebase. Μπορείτε να αφήσετε σχόλια στο Ομάδα Google για Firebase.

Οι προγραμματιστές με εμπειρία στο ML που θέλουν να δοκιμάσουν τον αλγόριθμο της Google για τη συμπίεση μοντέλων TensorFlow μπορούν Εγγραφείτε εδώ. Τέλος, ελέγξτε το Firebase Remote Config εάν θέλετε να πειραματιστείτε με πολλά προσαρμοσμένα μοντέλα. Σας επιτρέπει να αλλάζετε δυναμικά τιμές μοντέλου, να δημιουργείτε τμήματα πληθυσμού και να πειραματίζεστε με πολλά μοντέλα παράλληλα.