Direktetranskribering 2.1 forbereder seg på å legge til nødsirenedeteksjon, smarte segmenter og høyttaler-ID

Den siste oppdateringen for Live Transcribe-appen avslører tre kommende funksjoner, inkludert nødsirenedeteksjon, smarte segmenter og høyttaler-ID.

Tidligere i år hos Google I/O, selskapet introduserte to nye apper for Android for å hjelpe mennesker med hørselshemninger — direktetranskribering og lydforsterker. Mens begge appene opprinnelig var rettet mot hørselshemmede, Google senere oppdaterte Live Transkribering-appen for å hjelpe studenter og journalister også. Etter oppdateringen tillot appen brukere å lagre transkripsjoner lokalt på enheten sin, og den fikk til og med muligheten til å oppdage lydhendelser under transkripsjonen. Nå ser det ut til at Google forbereder appen til å introdusere tre funksjoner til.

En APK-nedrettelse kan ofte forutsi funksjoner som kan komme i en fremtidig oppdatering av en applikasjon, men det er mulig at noen av funksjonene vi nevner her kanskje ikke kommer i en fremtidig utgivelse. Dette er fordi disse funksjonene for øyeblikket ikke er implementert i live-bygget og kan trekkes når som helst av utviklerne i en fremtidig build.

En nedbrytning av den siste oppdateringen for Live Transscribe (versjon 2.1.276871059) avslører kodestrenger som antyder kommende funksjoner, inkludert Vis nødsirener, Smart Segment og Speaker ID. Vis nødsirener-funksjonen lar appen identifisere nødsirener og varsle brukere om det samme. Strengene inkluderer også en dialogboks for funksjonen som sier: "Vær forsiktig når sirener rapporteres. Husk at ikke alle sirener krever handling eller indikerer en relevant nødsituasjon (sirener på TV, for eksempel). Videre vil sirenedeteksjonen av og til gjøre feil."

<stringname="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.string>
<stringname="show_emergency_siren_title">Show Emergency Sirensstring>
<stringname="smart_segment">Smart segmentstring>
<stringname="smart_segment_summary">Segment transcript based on performance (rather than text length)string>
<stringname="speaker_id_title">Enable speaker IDstring>

Smart Segment-funksjonen vil dele opp transkripsjoner basert på ytelse, i stedet for tekstlengde, og Speaker ID-funksjonen vil hjelpe appen med å identifisere og merke høyttalerne i en pågående samtale. Vår sjefredaktør, Mishaal Rahman, tok også en titt på Live Transkriber GitHub-depot hvilken inneholder Android-klientbibliotekene som brukes til å kommunisere med Googles Cloud Speech API og fant ut at modulen Automatic Speech Recognition (ASR) har støtte for innebygd høyttaleridentifikasjon. Høyttaler-ID-implementeringen er imidlertid ikke gitt, og det ser ikke ut som appen har den for øyeblikket, men det kan endre seg i nær fremtid.

Takk til PNF Software for å gi oss en lisens til bruk JEB Dekompiler, et omvendt utviklingsverktøy av profesjonell kvalitet for Android-applikasjoner.