Transkrypcja na żywo 2.1 umożliwia dodanie funkcji wykrywania syreny alarmowej, inteligentnych segmentów i identyfikatora głośnika

Najnowsza aktualizacja aplikacji Transkrypcja na żywo ujawnia trzy nadchodzące funkcje, w tym wykrywanie syreny alarmowej, inteligentne segmenty i identyfikator głośnika.

Na początku tego roku na Google I/O firma wprowadził dwie nowe aplikacje dla Androida, aby pomóc osobom z wadami słuchu — Transkrypcja na żywo i Wzmacniacz dźwięku. Chociaż obie aplikacje były pierwotnie przeznaczone dla osób niedosłyszących, Google później je udostępniło zaktualizowałem aplikację Transkrypcja na żywo aby pomóc studentom i dziennikarzom. Po aktualizacji aplikacja umożliwiła użytkownikom zapisywanie transkrypcji lokalnie na urządzeniu, a nawet umożliwiła wykrywanie zdarzeń dźwiękowych podczas transkrypcji. Wygląda na to, że Google przygotowuje teraz aplikację do wprowadzenia trzech kolejnych funkcji.

Porzucenie pakietu APK często pozwala przewidzieć funkcje, które mogą pojawić się w przyszłej aktualizacji aplikacji, ale możliwe jest, że którakolwiek z funkcji, o których tutaj wspominamy, może nie zostać uwzględniona w przyszłej wersji. Dzieje się tak, ponieważ te funkcje nie są obecnie zaimplementowane w aktualnej wersji i mogą zostać pobrane przez programistów w dowolnym momencie w przyszłej wersji.

Porzucenie najnowszej aktualizacji Transkrypcji na żywo (wersja 2.1.276871059) ujawnia ciągi kodu wskazujące na nadchodzące funkcje, w tym Pokaż syreny alarmowe, Inteligentny segment i Identyfikator głośnika. Funkcja Pokaż syreny alarmowe pozwoli aplikacji identyfikować syreny alarmowe i ostrzegać o nich użytkowników. Ciągi zawierają także okno dialogowe funkcji, które stwierdza: „Proszę zachować ostrożność w przypadku zgłaszania syren. Pamiętaj, że nie wszystkie syreny wymagają działania lub sygnalizują odpowiednią sytuację awaryjną (np. syreny w telewizji). Co więcej, nasza syrena wykrywająca czasami popełnia błędy.”

<stringname="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.string>
<stringname="show_emergency_siren_title">Show Emergency Sirensstring>
<stringname="smart_segment">Smart segmentstring>
<stringname="smart_segment_summary">Segment transcript based on performance (rather than text length)string>
<stringname="speaker_id_title">Enable speaker IDstring>

Funkcja Smart Segment dzieli transkrypcje na podstawie wydajności, a nie długości tekstu, a funkcja Speaker ID pomaga aplikacji identyfikować i oznaczać osoby mówiące w toczącej się rozmowie. Nasz redaktor naczelny, Mishaal Rahman, również przyjrzał się temu Transkrypcja na żywo w repozytorium GitHub Który zawiera biblioteki klienta Androida używane do komunikacji z interfejsem Google Cloud Speech API i odkrył, że moduł automatycznego rozpoznawania mowy (ASR) obsługuje wbudowaną identyfikację osoby mówiącej. Jednak implementacja identyfikatora głośnika nie jest dostępna i nie wygląda na to, że aplikacja obecnie ją ma, ale może się to zmienić w najbliższej przyszłości.

Dziękujemy firmie PNF Software za udostępnienie nam licencji na użytkowanie Dekompilator JEB, profesjonalne narzędzie inżynierii wstecznej dla aplikacji na Androida.