Google, ML Kit에 엔터티 추출, 셀카 세분화 API 도입

Google은 ML Kit에 Entity Extraction과 Selfie Segmentation이라는 두 가지 새로운 API를 도입했습니다. 그들에 대해 더 자세히 알고 싶다면 계속 읽어보세요!

몇 년 전 구글은 ML Kit 출시 개발자가 앱에 기계 학습을 더 쉽게 구현할 수 있도록 합니다. 그 이후로 우리는 디지털 잉크 인식, 기기 내 번역 및 얼굴 감지를 위한 API를 보았습니다. 이제 Google은 새로운 Selfie Segmentation 기능과 함께 ML Kit에 새로운 항목 추출을 추가하고 있습니다.

구글은 말했다 새로운 엔터티 추출 API를 사용하면 개발자는 원시 텍스트에서 엔터티를 감지하고 찾고 해당 엔터티를 기반으로 조치를 취할 수 있습니다.

구글은 “API는 정적 텍스트에서 작동할 뿐만 아니라 사용자가 입력하는 동안 실시간으로도 작동한다”고 말했다. "개발자가 사용자에게 더 풍부한 텍스트 상호 작용 경험을 제공할 수 있도록 11가지 엔터티와 15가지 언어(향후 더 많은 언어 지원 예정)를 지원합니다."

지원되는 엔터티는 다음과 같습니다.

주소(350 3번가, 캠브리지)
날짜 시간*(2020.12.12 내일 오후 3시) (내일 오후 6시에 만나요)
이메일([email protected])
항공편 번호*(LX37)
이반*(CH52 0483 0000 0000 0000 9)
ISBN*(978-1101904190)
돈(화폐 포함)*($12, 25달러)
지불 카드*(4111 1111 1111 1111)
전화 번호((555) 225-3556, 12345)
추적 번호*(1Z204E380338943508)
URL(www.google.com, https://en.wikipedia.org/wiki/Platypus, seznam.cz)

Google은 앱이 채팅 대화 중에 사용자에게 유용한 제안을 제공할 수 있도록 TamTam과 함께 Entity Extraction API를 테스트하고 있다고 밝혔습니다. 예를 들어 화면에 주소가 있는 경우 해당 주소를 클릭하면 주소를 복사하거나, 다른 앱으로 열거나, 해당 위치로 가는 길을 찾을 수 있는 메뉴가 나타납니다.

Entity Extraction API의 신경망 주석자/모델은 다음과 같이 작동합니다. 주어진 입력 텍스트는 먼저 공백 구분을 기준으로 단어로 분할된 다음 가능한 모든 단어 하위 시퀀스로 분할됩니다. 특정 최대 길이(위 예에서는 15단어)가 생성되고 각 후보에 대해 채점 신경망은 유효한 엔터티를 나타내는지 여부에 따라 값(0에서 1 사이)을 할당합니다.

다음으로, 중복되는 생성된 엔터티가 제거되어 낮은 점수를 가진 충돌하는 엔터티보다 높은 점수를 가진 엔터티를 선호합니다. 그런 다음 두 번째 신경망을 사용하여 엔터티 유형을 전화번호, 주소 또는 경우에 따라 비엔티티로 분류합니다.

Google은 ML Kit의 Entity Extraction API가 Android 10에 도입된 Smart Linkify 기능을 지원하는 기술을 기반으로 한다고 밝혔습니다.

Google은 텍스트 기반 엔터티 추출 외에도 새로운 Selfie Segmentation API도 발표했습니다. 이 기능을 사용하면 개발자가 배경을 장면에서 분리할 수 있습니다. 이를 통해 사용자는 셀카에 멋진 효과를 추가하거나 더 나은 배경에 자신을 삽입할 수도 있습니다. 구글은 새로운 API가 안드로이드와 iOS 모두에서 낮은 지연 시간으로 훌륭한 결과를 생성할 수 있다고 말했습니다.

ML Kit SDK는 기계 학습에 대한 Google의 수년간의 작업을 모바일 앱 개발자가 앱을 향상하는 데 사용할 수 있는 Firebase 패키지에 통합합니다. ML Kit가 도입된 이후 개발자가 앱에서 기계 학습 기반 기능을 훨씬 쉽게 구현할 수 있게 해주는 다양한 API가 공개되었습니다. 엔터티 추출 및 셀카 분할을 통해 미래의 앱은 더욱 향상될 것입니다.