Live Transcribe 2.1 si prepara ad aggiungere il rilevamento della sirena di emergenza, i segmenti intelligenti e l'ID dell'altoparlante

click fraud protection

L'ultimo aggiornamento dell'app Trascrizione istantanea rivela tre funzionalità imminenti, tra cui il rilevamento della sirena di emergenza, i segmenti intelligenti e l'ID dell'altoparlante.

All'inizio di quest'anno al Google I/O, l'azienda ha introdotto due nuove app per Android per aiutare le persone con disabilità uditive: Live Transcribe e Sound Amplifier. Sebbene entrambe le app fossero originariamente rivolte ai non udenti, Google in seguito aggiornata l'app Trascrizione istantanea per aiutare anche studenti e giornalisti. In seguito all'aggiornamento, l'app ha consentito agli utenti di salvare le trascrizioni localmente sul proprio dispositivo e ha anche ottenuto la capacità di rilevare eventi sonori durante la trascrizione. Ora, sembra che Google stia preparando l'app per introdurre altre tre funzionalità.

Uno smontaggio dell'APK può spesso prevedere funzionalità che potrebbero essere presenti in un futuro aggiornamento di un'applicazione, ma è possibile che qualcuna delle funzionalità menzionate qui non sia presente in una versione futura. Questo perché queste funzionalità non sono attualmente implementate nella build live e potrebbero essere ritirate in qualsiasi momento dagli sviluppatori in una build futura.

Uno smontaggio dell'ultimo aggiornamento per Live Transcribe (versione 2.1.276871059) rivela stringhe di codice che suggeriscono funzionalità imminenti, tra cui Mostra sirene di emergenza, Segmento intelligente e ID altoparlante. La funzione Mostra sirene di emergenza consentirà all'app di identificare le sirene di emergenza e avvisare gli utenti delle stesse. Le stringhe includono anche una finestra di dialogo per la funzione che afferma: "Prestare attenzione quando vengono segnalate sirene. Ricorda che non tutte le sirene richiedono un intervento o indicano un'emergenza rilevante (ad esempio le sirene della TV). Inoltre, il rilevamento delle nostre sirene occasionalmente commetterà errori."

<stringname="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.string>
<stringname="show_emergency_siren_title">Show Emergency Sirensstring>
<stringname="smart_segment">Smart segmentstring>
<stringname="smart_segment_summary">Segment transcript based on performance (rather than text length)string>
<stringname="speaker_id_title">Enable speaker IDstring>

La funzione Smart Segment dividerà le trascrizioni in base alle prestazioni, anziché alla lunghezza del testo, e la funzione ID oratore aiuterà l'app a identificare ed etichettare gli oratori in una conversazione in corso. Anche il nostro caporedattore, Mishaal Rahman, ha dato un'occhiata a Repository GitHub di trascrizione istantanea Quale contiene le librerie client Android utilizzate per comunicare con l'API Cloud Speech di Google e ho scoperto che il modulo di riconoscimento vocale automatico (ASR) supporta l'identificazione incorporata dell'oratore. Tuttavia, l'implementazione dell'ID dell'altoparlante non viene fornita e non sembra che l'app la disponga attualmente, ma ciò potrebbe cambiare nel prossimo futuro.


Grazie a PNF Software per averci fornito una licenza d'uso Decompilatore JEB, uno strumento di reverse engineering di livello professionale per applicazioni Android.