Okamžitý přepis 2.1 se připravuje na přidání detekce nouzové sirény, inteligentních segmentů a ID reproduktoru

click fraud protection

Nejnovější aktualizace aplikace Okamžitý přepis odhaluje tři nadcházející funkce, včetně nouzové detekce sirén, inteligentních segmentů a Speaker ID.

Začátkem tohoto roku na Google I/O, společnost představil dvě nové aplikace pro Android na pomoc lidem se sluchovým postižením — Okamžitý přepis a zesilovač zvuku. Zatímco obě aplikace byly původně zaměřeny na sluchově postižené, Google později aktualizovala aplikaci Okamžitý přepis pomoci také studentům a novinářům. Po aktualizaci aplikace umožnila uživatelům ukládat přepisy lokálně na jejich zařízení a dokonce získala možnost detekovat zvukové události během přepisu. Nyní se zdá, že Google připravuje aplikaci, aby představila další tři funkce.

Zrušení souboru APK může často předvídat funkce, které se mohou objevit v budoucí aktualizaci aplikace, ale je možné, že některá z funkcí, které zde zmiňujeme, se v budoucím vydání nemusí objevit. Je to proto, že tyto funkce nejsou v současné době v živém sestavení implementovány a vývojáři je mohou kdykoli stáhnout v budoucím sestavení.

Zrušení nejnovější aktualizace pro Okamžitý přepis (verze 2.1.276871059) odhaluje řetězce kódu, které naznačují připravované funkce, včetně Show Emergency Sirens, Smart Segment a Speaker ID. Funkce Zobrazit nouzové sirény umožní aplikaci identifikovat nouzové sirény a upozornit na ně uživatele. Řetězce také obsahují dialog pro funkci, který říká: „Buďte opatrní, když jsou hlášeny sirény. Pamatujte, že ne všechny sirény vyžadují akci nebo indikují relevantní nouzovou situaci (například sirény v televizi). Navíc naše detekce sirén občas udělá chyby."

<stringname="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.string>
<stringname="show_emergency_siren_title">Show Emergency Sirensstring>
<stringname="smart_segment">Smart segmentstring>
<stringname="smart_segment_summary">Segment transcript based on performance (rather than text length)string>
<stringname="speaker_id_title">Enable speaker IDstring>

Funkce Smart Segment rozdělí přepisy podle výkonu, nikoli podle délky textu, a funkce Speaker ID pomůže aplikaci identifikovat a označit mluvčí v probíhající konverzaci. Na to se podíval i náš šéfredaktor Mishaal Rahman Živý přepis úložiště GitHub který obsahuje klientské knihovny Android používané ke komunikaci s rozhraním Google Cloud Speech API a zjistili, že modul automatického rozpoznávání řeči (ASR) má podporu pro vestavěnou identifikaci reproduktorů. Implementace ID mluvčího však není k dispozici a nezdá se, že by ji aplikace aktuálně měla, ale to by se mohlo v blízké budoucnosti změnit.


Děkujeme společnosti PNF Software za poskytnutí licence k použití JEB dekompilátor, profesionální nástroj zpětného inženýrství pro aplikace Android.