ცოცხალი ტრანსკრიფცია 2.1 ემზადება გადაუდებელი სირენის ამოცნობის, ჭკვიანი სეგმენტების და სპიკერის ID-ს დასამატებლად

click fraud protection

ცოცხალი ტრანსკრიფციის აპის უახლესი განახლება გამოავლენს სამ მომავალ ფუნქციას, მათ შორის, გადაუდებელი სირენის ამოცნობა, ჭკვიანი სეგმენტები და სპიკერის ID.

ამ წლის დასაწყისში კომპანია Google I/O-ში წარმოადგინა ორი ახალი აპლიკაცია Android-ისთვის სმენის შეზღუდული შესაძლებლობის მქონე ადამიანების დასახმარებლად — ცოცხალი ტრანსკრიფცია და ხმის გამაძლიერებელი. მიუხედავად იმისა, რომ ორივე აპი თავდაპირველად მიმართული იყო სმენის დაქვეითებისკენ, მოგვიანებით Google განაახლეს ცოცხალი ტრანსკრიფციის აპი დაეხმაროს სტუდენტებს და ჟურნალისტებსაც. განახლების შემდეგ, აპმა მომხმარებლებს საშუალება მისცა შეენახათ ტრანსკრიფციები ადგილობრივად თავიანთ მოწყობილობაზე და მას მიეცა შესაძლებლობა გამოეჩინა ხმოვანი მოვლენები ტრანსკრიფციის დროს. ახლა, როგორც ჩანს, Google ამზადებს აპს კიდევ სამი ფუნქციის დასანერგად.

APK-ის დაშლას ხშირად შეუძლია იწინასწარმეტყველოს ფუნქციები, რომლებიც შეიძლება მოვიდეს აპლიკაციის მომავალ განახლებაში, მაგრამ შესაძლებელია, რომ ჩვენ მიერ აქ ნახსენები რომელიმე მახასიათებელი არ იყოს ის მომავალ გამოშვებაში. ეს იმიტომ ხდება, რომ ეს ფუნქციები ამჟამად არ არის დანერგილი ცოცხალ build-ში და შეიძლება ნებისმიერ დროს გამოიყვანონ დეველოპერებმა მომავალ build-ში.

Live Transcript-ის უახლესი განახლების ამოღება (ვერსია 2.1.276871059) ავლენს კოდის სტრიქონებს, რომლებიც მიანიშნებენ მომავალ ფუნქციებზე, მათ შორის, გადაუდებელი სირენების ჩვენება, ჭკვიანი სეგმენტი და სპიკერის ID. Emergency Sirens ფუნქცია საშუალებას მისცემს აპს ამოიცნოს საგანგებო სირენები და გააფრთხილოს მათი მომხმარებლები. სტრიქონები ასევე შეიცავს დიალოგს მახასიათებლისთვის, რომელშიც ნათქვამია: „გთხოვთ გამოიჩინოთ სიფრთხილე სირენების მოხსენებისას. გახსოვდეთ, რომ ყველა სირენა არ საჭიროებს მოქმედებას ან მიუთითებს შესაბამის საგანგებო სიტუაციაზე (სირენები ტელევიზორზე, მაგალითად). გარდა ამისა, ჩვენი სირენის გამოვლენა ზოგჯერ შეცდომებს უშვებს. ”

<stringname="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.string>
<stringname="show_emergency_siren_title">Show Emergency Sirensstring>
<stringname="smart_segment">Smart segmentstring>
<stringname="smart_segment_summary">Segment transcript based on performance (rather than text length)string>
<stringname="speaker_id_title">Enable speaker IDstring>

Smart Segment ფუნქცია დაყოფს ტრანსკრიპტებს შესრულების მიხედვით, ტექსტის სიგრძის ნაცვლად, ხოლო Speaker ID ფუნქცია დაეხმარება აპს დინამიკების იდენტიფიცირებაში და მარკირებაში მიმდინარე საუბარში. ჩვენმა მთავარმა რედაქტორმა, მიშაალ რაჰმანმაც დაათვალიერა ცოცხალი ტრანსკრიფცია GitHub საცავი რომელიც შეიცავს Android კლიენტის ბიბლიოთეკებს, რომლებიც გამოიყენება Google-ის Cloud Speech API-სთან კომუნიკაციისთვის და აღმოაჩინა, რომ მეტყველების ავტომატური ამოცნობის (ASR) მოდულს აქვს ჩაშენებული დინამიკის იდენტიფიკაციის მხარდაჭერა. თუმცა, სპიკერის ID იმპლემენტაცია არ არის მოწოდებული და როგორც ჩანს, აპს არ აქვს ის ამჟამად, მაგრამ ეს შეიძლება შეიცვალოს უახლოეს მომავალში.


მადლობა PNF Software-ს, რომ მოგვაწოდა გამოყენების ლიცენზია JEB დეკომპილერი, პროფესიული დონის საპირისპირო ინჟინერიის ინსტრუმენტი Android აპლიკაციებისთვის.