[Актуализация: Надписи на живо на „Избрани телефони“] Google работи за достъпност с надписи на живо на Android Q, предаване на живо и транскрибиране на живо

click fraud protection

На Google I/O 2019 Google разкри усилията си за достъпност като Live Caption на Android Q, Live Relay и Live Transcribe. Прочетете!

Актуализация 1 (10.05.19 @ 23:53 ET): Според VentureBeat, Live Caption няма да бъде наличен на всички устройства с Android Q. Повече подробности по-долу.

Ние като потребители често приемаме света около нас за даденост. Това, което преживяваме, предполагаме, че същото се преживява от всички около нас в подобен смисъл, ако не и по същия начин. Тази презумпция продължава да обхваща всяка част от нашия живот, включително технологиите. Но уврежданията са реални и животът с тях се превръща в предизвикателство поради тези презумпции. По този начин достъпността се превръща във важна тема и Google изпълнява своята роля, за да гарантира, че хората с увреждания имат справедлива възможност да се наслаждават на тези преживявания. Android Q интегрира няколко от усилията на Google за достъпност, за да направи Android много по-сплотено изживяване, въпреки че не всички функции, споменати по-долу, са налични в Android в момента.

Надписи на живо

Много от нас никога не си правят труда да хвърлят втори поглед на настройките за надписи, а също така консумираме много медии, без дори да забележим липсата на надписи. Но за 466 милиона души по света, които са глухи и с увреден слух, надписите служат на цел, по-голяма от удобство - те са самата среда на преживяване. Android Q интегрира Live Captions, което позволява на потребителите от общността на глухите да имат достъп до преживявания с много повече лекота и универсалност.

След като настройката бъде активирана, Live Caption автоматично ще надписва мултимедия, която възпроизвежда аудио на вашето устройство с едно докосване. Live Caption работи с видеоклипове, подкасти, аудио съобщения и всяко друго приложение – дори с неща, които се записват на устройството. Надписите ще се появят веднага щом бъде открит говор, който се възпроизвежда на устройството. И тъй като всичко това се случва чрез разпознаване на реч в устройството, нито звукът, нито надписите напускат телефона ви и можете да използвате функцията, без да се нуждаете от WiFi или клетъчни данни.

Актуализация 5/10/19: Google потвърди с VentureBeat че Live Caption ще "идват за избрани телефони с Android Q по-късно тази година." По-конкретно, „избрани устройства от по-висок клас“, според Браян Кемлър, продуктов мениджър за достъпност на Android. Причината очевидно се дължи на ограниченията на паметта и пространството. Първоначалното внедряване ще бъде ограничено, но ще се разширява с течение на времето и Google планира да пусне списък с устройства, които ще получат поддръжка за Live Caption, тъй като наближаваме първото публично издание на Android Q.

Освен това Google потвърди, че запазването на транскрипция няма да е възможно с Live Captions (поради умишлено ограничение в AudioPlaybackCaptureConfiguration API), че няма да работи с телефонни обаждания, гласови повиквания или видео разговори (защото не се поддържа от API) и че ще поддържа само надписи на английски на стартиране. След като функцията стартира, офлайн модел ще бъде изтеглен и актуализациите на модела ще се обслужват чрез услугите на Google Play.

Щафета на живо

Live Relay се основава на идеите, предложени от Live Caption, като позволява на хората да правят и получават телефонни обаждания, без да се налага да говорят или чуват.

Live Relay използва разпознаване на говор на устройството и преобразуване на текст в говор, за да позволи на телефона да слуша аудио разговор и след това да изговаря отговори от името на потребителя, който въвежда отговорите. Функцията работи в тандем с функции за предложения за предсказуемо писане, като напр Интелигентно композиране и Интелигентен отговор, което улеснява провеждането на разговор на живо чрез подпомагане на бързите отговори. Live Relay работи изцяло на устройството, така че разговорите все още са частни. Тъй като Live Relay взаимодейства с другата страна чрез обикновено телефонно обаждане, тя може да работи и със стационарни линии от другата страна.

Въпреки че Live Relay със сигурност би било полезно за общността на глухите и немите, случаите на употреба се простират до ситуации, при които някой може да не е в състояние да говори или да чуе телефонно обаждане в този момент, но все пак желае да взаимодейства с него. Google също е оптимист за интегрирането на възможност за превод в реално време в Live Relay, което от своя страна има потенциала да позволи на всеки да се обажда на всеки друг по света и да общува независимо от езиковите бариери.

Google заявява, че Live Relay все още е във фаза на проучване. Не е ясно дали функцията е интегрирана в текущите компилации на Android Q – предполагаме, че тя ще стигне до устройства с Android в бъдеще.

Препис на живо – Разширение за потребители с говорни увреждания

Преписът на живо беше показан от Google по-рано тази година като инструмент за глухи потребители да се възползват от транскрипция на живо на реч около тях. Приложението имаше за цел да направи ежедневните разговори по-достъпни, като преобразува реч от реалния свят през микрофона на телефона в надписи в реално време. Незабавно преписване е вече е налице като бета версия с ограничен ранен достъп през Play Store, с поддръжка на над 70 езика и диалекта. Приложението също е предварително инсталирано на устройства Pixel 3.

Незабавно преписване и известяванеРазработчик: Проучване в Google

Цена: Безплатно.

3.8.

Изтегли

Последните усилия на Google за подобряване на достъпността разширяват транскрибиране на живо не само до глухи потребители, но и до потребители с говорни увреждания чрез Project Euphonia.

Екипът по Project Euphonia използва AI, за да подобри способността на компютъра да разбира различни говорни модели, включително нарушена реч. Google си партнира с организации с нестопанска цел като ALS Therapy Development Institute и ALS Residence Initiative, за да записват гласовете на хората засегнати от ALS, и след това използвайте тези записи, за да обучите AI моделите да транскрибират по-надеждно думи, изречени от хора с този вид реч трудности. Настоящият набор от AI алгоритми работят с английския език, за да се адаптират към лица, които имат увреждания свързани с ALS, но Google е оптимист за прилагането на изследването към по-големи групи и различна реч увреждания.

Освен това Google също надгражда това, като обучава персонализирани AI алгоритми за откриване на звуци и жестове и след това предприемайте действия като генериране на гласови команди към Google Home или изпращане на текст съобщения. Този случай на използване е особено полезен за хора, които са с тежки увреждания, не могат да говорят и могат да взаимодействат само с неговорни звуци и жестове на лицето.

Тези нови функционалности изглежда все още не са активни в рамките на Незабавно преписване. Google иска помощ от доброволци, които имат неясна или трудна за разбиране реч, и ако желаят да запишат набор от фрази, за да помогнат за по-нататъшното обучение на системата, за да работи по-добре. Ако отговаряте на условията и искате да станете доброволец, моля попълнете формата за същото.

Усилията на Google за подобряване на достъпността на технологиите определено са похвални. Надяваме се, че повече софтуерни компании работят за предоставяне на хора с различни способности на справедливо преживяване на света.


Източник 1: GoogleИзточник 2: GoogleИзточник 3: Google