Google представляет API-интерфейсы извлечения сущностей и сегментации селфи в ML Kit

Google представила два новых API для ML Kit: извлечение сущностей и сегментацию селфи. Читайте дальше, чтобы узнать о них больше!

Несколько лет назад Google представлен комплект ML чтобы разработчикам было проще внедрять машинное обучение в свои приложения. С тех пор мы видели API для распознавания цифровых рукописных данных, перевода на устройстве и распознавания лиц. Теперь Google добавляет в ML Kit новый инструмент извлечения сущностей, а также новую функцию сегментации селфи.

Google сказал новый API извлечения сущностей позволит разработчикам обнаруживать и находить объекты из необработанного текста и предпринимать действия на основе этих объектов.

«API работает со статическим текстом, а также в режиме реального времени, пока пользователь печатает», — заявили в Google. «Он поддерживает 11 различных сущностей и 15 различных языков (в будущем их будет больше), что позволит разработчикам сделать любое текстовое взаимодействие более интересным для пользователя».

Вот объекты, которые поддерживаются:

Адрес(350 Третья улица, Кембридж)
Дата-Время*(12.12.2020, завтра в 15.00) (встретимся завтра в 18.00)
Электронная почта([email protected])
Номер рейса*(ЛХ37)
IBAN*(CH52 0483 0000 0000 0000 9)
ISBN*(978-1101904190)
Деньги (включая валюту)*(12, 25 долларов США)
Карта оплаты*(4111 1111 1111 1111)
Номер телефона((555) 225-3556, 12345)
Идентификационный номер*(1Z204E380338943508)
URL-адрес(www.google.com, https://en.wikipedia.org/wiki/Platypus, seznam.cz)

Google заявил, что тестирует API Entity Extraction API с TamTam, чтобы приложение могло предоставлять полезные предложения пользователям во время разговоров в чате. Например, когда адрес отображается на экране, нажатие на него вызывает меню, позволяющее скопировать адрес, открыть его в другом приложении или проложить маршрут к месту.

Аннотаторы/модели нейронной сети в API Entity Extraction работают следующим образом: заданный входной текст сначала разбивается на слова (на основе разделения пробелов), затем все возможные подпоследовательности слов из генерируется определенная максимальная длина (15 слов в примере выше), и каждому кандидату оценочная нейронная сеть присваивает значение (от 0 до 1) в зависимости от того, представляет ли он действительный объект.

Затем сгенерированные объекты, которые перекрываются, удаляются, отдавая предпочтение объектам с более высоким баллом по сравнению с конфликтующими объектами с более низким рейтингом. Затем вторая нейронная сеть используется для классификации типа сущности как номера телефона, адреса или, в некоторых случаях, не-сущности.

В Google заявили, что API Entity Extraction API ML Kit основан на технологии, лежащей в основе функции Smart Linkify, представленной в Android 10.

В дополнение к извлечению сущностей на основе текста Google также анонсировал новый API-интерфейс сегментации селфи. Эта функция позволит разработчикам отделить фон от сцены. Это позволит пользователям добавлять интересные эффекты к селфи или даже вставлять себя на более красивый фон. Google заявил, что новый API способен давать отличные результаты с низкой задержкой как на Android, так и на iOS.

ML Kit SDK объединяет годы работы Google в области машинного обучения в пакете Firebase, который разработчики мобильных приложений могут использовать для улучшения своих приложений. С момента появления ML Kit был представлен ряд API, которые значительно упрощают реализацию функций машинного обучения в приложениях для разработчиков. Благодаря извлечению сущностей и сегментации селфи приложения будущего станут еще лучше.