[განახლება: პირდაპირი წარწერები „Select Phones“] Google მუშაობს წვდომაზე Live Subtion-ით Android Q-ზე, Live Relay-სა და Live Transcrib-ზე

Google I/O 2019-ზე Google-მა გამოავლინა თავისი ძალისხმევა ხელმისაწვდომობის მიმართ, როგორიცაა Live Caption Android Q-ზე, Live Relay და Live Transcript. წაიკითხეთ!

განახლება 1 (5/10/19 @ 23:53 ET): Მიხედვით VentureBeat, ცოცხალი წარწერა არ იქნება ხელმისაწვდომი ყველა მოწყობილობაზე, რომელიც მუშაობს Android Q-ზე. დამატებითი დეტალები ქვემოთ.

ჩვენ, როგორც მომხმარებლები, ხშირად ვიღებთ ჩვენს გარშემო არსებულ სამყაროს. რასაც ჩვენ განვიცდით, ჩვენ ვვარაუდობთ, რომ იგივეს განიცდის ყველა ჩვენს ირგვლივ მსგავსი გაგებით, თუ არა იგივე. ეს ვარაუდი ვრცელდება ჩვენი ცხოვრების ყველა ნაწილზე, მათ შორის ტექნოლოგიაზე. მაგრამ შეზღუდული შესაძლებლობები რეალურია და მათთან ერთად ცხოვრება ამ ვარაუდების გამო რთული ამოცანა ხდება. ამრიგად, ხელმისაწვდომობა მნიშვნელოვან თემად იქცევა და Google თავის წილს აკეთებს იმაში, რომ შეზღუდული შესაძლებლობის მქონე ადამიანებს ჰქონდეთ თანაბარი შესაძლებლობა ამ გამოცდილებით სარგებლობისთვის. Android Q აერთიანებს Google-ის ხელმისაწვდომობის რამდენიმე მცდელობას, რათა Android-ი უფრო შეკრული გამოცდილება გახდეს, თუმცა ქვემოთ მოყვანილი ყველა ფუნქცია ახლა არ არის ხელმისაწვდომი Android-ში.

პირდაპირი წარწერა

ბევრ ჩვენგანს არასოდეს აწუხებს სუბტიტრების პარამეტრებს მეორედ გადახედვა და ასევე ვხმარობთ უამრავ მედიას ისე, რომ არც კი შევამჩნიოთ სუბტიტრების არარსებობა. მაგრამ 466 მილიონი ადამიანისთვის მთელს მსოფლიოში, რომლებიც ყრუ და სმენადაქვეითებულნი არიან, წარწერები უფრო მეტ მიზანს ემსახურება, ვიდრე მოხერხებულობა -- ისინი გამოცდილების მთავარი საშუალებაა. Android Q აერთიანებს ცოცხალ სუბტიტრებს, რაც საშუალებას აძლევს მომხმარებლებს ყრუ საზოგადოებისგან მიიღონ გამოცდილება უფრო მარტივი და უნივერსალურობით.

პარამეტრის ჩართვის შემდეგ, Live Caption ავტომატურად მოათავსებს სუბტიტრებს მედიას, რომელიც უკრავს აუდიოს თქვენს მოწყობილობაზე ერთი შეხებით. პირდაპირი წარწერა მუშაობს ვიდეოებთან, პოდკასტებთან, აუდიო შეტყობინებებთან და ნებისმიერ სხვა აპთან - თუნდაც მოწყობილობაზე ჩაწერილი ნივთებით. სუბტიტრები გამოჩნდება როგორც კი მოწყობილობაზე მეტყველება გამოვლინდება. და რადგან ეს ყველაფერი ხდება მოწყობილობაზე მეტყველების ამოცნობის მეშვეობით, არც აუდიო და არც წარწერები არ ტოვებს თქვენს ტელეფონს და თქვენ შეგიძლიათ გამოიყენოთ ფუნქცია WiFi ან ფიჭური მონაცემების გარეშე.

განახლება 5/10/19: Google-მა დაადასტურა VentureBeat რომ Live Caption იქნება "ამ წლის ბოლოს Android Q მომუშავე ტელეფონებზე". კონკრეტულად, "არჩეული, უფრო მაღალი დონის მოწყობილობები", ბრაიან კემლერის, Android ხელმისაწვდომობის პროდუქტის მენეჯერის მიხედვით. მიზეზი აშკარად მეხსიერების და სივრცის შეზღუდვის გამოა. თავდაპირველი გამოშვება შეზღუდული იქნება, მაგრამ დროთა განმავლობაში გაფართოვდება და Google გეგმავს გამოაქვეყნოს მოწყობილობების სია, რომლებიც მიიღებენ მხარდაჭერას Live Caption-ისთვის, როდესაც მივუახლოვდებით Android Q-ის პირველ საჯარო გამოშვებას.

გარდა ამისა, Google-მა დაადასტურა, რომ ტრანსკრიფციის შენახვა შეუძლებელია ცოცხალი სუბტიტრებით (AudioPlaybackCaptureConfiguration-ში განზრახ შეზღუდვის გამო API), რომ ის არ იმუშავებს სატელეფონო ზარებთან, ხმოვან ზარებთან ან ვიდეო ზარებთან (რადგან ის არ არის მხარდაჭერილი API-ს მიერ) და რომ ის მხარს დაუჭერს მხოლოდ სუბტიტრებს ინგლისურ ენაზე: გაშვება. ფუნქციის გაშვების შემდეგ ჩამოიტვირთება ოფლაინ მოდელი და მოდელის განახლებები Google Play Services-ის მეშვეობით მოემსახურება.

ცოცხალი ესტაფეტა

Live Relay ეფუძნება Live Subtion-ის იდეებს, რაც საშუალებას აძლევს ადამიანებს განახორციელონ და მიიღონ სატელეფონო ზარები ლაპარაკის ან მოსმენის გარეშე.

Live Relay იყენებს მოწყობილობაზე მეტყველების ამოცნობას და ტექსტიდან მეტყველების გადაქცევას, რათა ტელეფონს მოისმინოს აუდიოზარი და შემდეგ გამოთქვას პასუხები მომხმარებლის სახელით, რომელიც აკრიფებს პასუხებს. ფუნქცია მუშაობს პროგნოზირებადი წერის შეთავაზების ფუნქციებთან ერთად, როგორიცაა ჭკვიანი შედგენა და ჭკვიანი პასუხი, აადვილებს პირდაპირი ზარის ჩატარებას სწრაფი პასუხების დახმარებით. Live Relay მუშაობს მთლიანად მოწყობილობაზე, ამიტომ ზარები კვლავ პირადია. ვინაიდან Live Relay ურთიერთქმედებს მეორე მხარესთან რეგულარული სატელეფონო ზარის საშუალებით, მას ასევე შეუძლია იმუშაოს მეორე მხარეს სახმელეთო ხაზებთან.

მიუხედავად იმისა, რომ Live Relay ნამდვილად გამოსადეგი იქნებოდა ყრუ საზოგადოებისა და მუნჯი საზოგადოებისთვის, მისი გამოყენების შემთხვევები ვრცელდება სიტუაციები, როდესაც ვიღაცამ შეიძლება ვერ შეძლოს საუბარი ან მოისმინოს სატელეფონო ზარი იმ მომენტში, მაგრამ მაინც სურს ურთიერთობა მასთან ერთად. Google ასევე ოპტიმისტურად არის განწყობილი რეალურ დროში თარგმანის შესაძლებლობის ინტეგრირებაზე Live Relay-ში, რაც თავის მხრივ აქვს პოტენციალი, რომ ვინმეს დარეკოს მსოფლიოში და დაუკავშირდეს ენობრივი ბარიერების მიუხედავად.

Google აცხადებს, რომ Live Relay ჯერ კიდევ კვლევის ფაზაშია. ჯერ არ არის ნათელი, არის თუ არა ფუნქცია ინტეგრირებული Android Q-ის ამჟამინდელ კონსტრუქციებში - ჩვენ ვვარაუდობთ, რომ ის მომავალში Android მოწყობილობებში გაივლის.

ცოცხალი ტრანსკრიფცია -- გაფართოება მეტყველების დარღვევის მქონე მომხმარებლებისთვის

ცოცხალი ტრანსკრიფცია აჩვენა Google-მა ამ წლის დასაწყისში, როგორც ინსტრუმენტი ყრუ მომხმარებლებისთვის, რათა ისარგებლონ მათ გარშემო მეტყველების ცოცხალი ტრანსკრიფციით. აპლიკაციის მიზანი იყო ყოველდღიური საუბრები უფრო ხელმისაწვდომი გახადოს ტელეფონის მიკროფონის მეშვეობით რეალურ სამყაროში არსებული მეტყველების რეალურ დროში წარწერებად გადაქცევით. ცოცხალი ტრანსკრიფცია არის უკვე ხელმისაწვდომია როგორც ადრეული წვდომის შეზღუდული ბეტა Play Store-ის მეშვეობით70-ზე მეტი ენისა და დიალექტის მხარდაჭერით. აპი ასევე წინასწარ არის დაინსტალირებული Pixel 3 მოწყობილობებზე.

პირდაპირი ტრანსკრიფცია და შეტყობინებაშემქმნელი: კვლევა Google-ში

ფასი: უფასო.

3.8.

ჩამოტვირთვა

Google-ის უახლესი მცდელობები ხელმისაწვდომობის გასაუმჯობესებლად ავრცელებს Live Transcript-ს არა მხოლოდ ყრუ მომხმარებლებისთვის, არამედ იმ მომხმარებლებისთვისაც, რომლებსაც აქვთ მეტყველების დაქვეითება Project Euphonia-ის მეშვეობით.

პროექტი Euphonia-ის ქვეშ მყოფი გუნდი იყენებს AI-ს, რათა გააუმჯობესოს კომპიუტერის უნარი, გაიგოს სხვადასხვა მეტყველების შაბლონები, მათ შორის დაქვეითებული მეტყველება. Google თანამშრომლობს არაკომერციულ ორგანიზაციებთან, როგორიცაა ALS Therapy Development Institute და ALS Residence Initiative ხალხის ხმების ჩასაწერად. დაზარალდა ALS-ით და შემდეგ გამოიყენე ეს ჩანაწერები ხელოვნური ინტელექტის მოდელების მოსამზადებლად, რათა უფრო საიმედოდ გადმოწერონ ასეთი მეტყველების მქონე ადამიანების მიერ ნათქვამი სიტყვები სირთულეები. ხელოვნური ინტელექტის ალგორითმების ამჟამინდელი ნაკრები მუშაობს ინგლისურ ენაზე, რათა მოერგოს უნარშეზღუდულ პირებს დაკავშირებულია ALS-თან, მაგრამ Google ოპტიმისტურად არის განწყობილი კვლევის უფრო დიდ ჯგუფებზე და სხვადასხვა მეტყველების მიმართ გაუფასურებები.

გარდა ამისა, Google ასევე ეფუძნება ამას პერსონალიზებული AI ალგორითმების გაწვრთნით, რათა აღმოაჩინოს ხმები და ჟესტებით, შემდეგ კი განახორციელეთ ისეთი მოქმედებები, როგორიცაა Google Home-ში გახმოვანებული ბრძანებების გენერირება ან ტექსტის გაგზავნა შეტყობინებები. გამოყენების ეს შემთხვევა განსაკუთრებით სასარგებლოა იმ ადამიანებისთვის, რომლებიც მძიმედ არიან შეზღუდული შესაძლებლობის მქონე პირებს, არ შეუძლიათ ლაპარაკი და შეუძლიათ მხოლოდ არასამეტყველო ბგერებთან და სახის ჟესტებთან ურთიერთობა.

როგორც ჩანს, ეს ახალი ფუნქციები ჯერ არ არის ცოცხალი ტრანსკრიფციის ფარგლებში. Google დახმარებას ითხოვს მოხალისეებისგან, რომლებსაც აქვთ ბუნდოვანი ან ძნელად გასაგები მეტყველება, და თუ მათ სურთ ჩაწერონ ფრაზების ნაკრები, რათა დაეხმარონ სისტემის შემდგომ სწავლებას უკეთესად მუშაობისთვის. თუ უფლება გაქვთ და გსურთ მოხალისედ გახდეთ, გთხოვთ შეავსეთ იგივე ფორმა.

Google-ის ძალისხმევა ტექნოლოგიის ხელმისაწვდომობის გასაუმჯობესებლად, რა თქმა უნდა, დასაფასებელია. ჩვენ ვიმედოვნებთ, რომ უფრო მეტი პროგრამული უზრუნველყოფის კომპანია იმუშავებს იმისთვის, რომ განსხვავებული შესაძლებლობების მქონე პირებს უზრუნველვყოთ მსოფლიოს სამართლიანი გამოცდილება.


წყარო 1: Googleწყარო 2: Googleწყარო 3: Google