5 caracteristici AI Copilot din Windows 11 trebuie să fie cu adevărat util

Copilot ar putea fi o completare interesantă pentru Windows 11, dar dacă Microsoft dorește ca acesta să fie valoros, are nevoie de aceste capacități.

Legături rapide

  • Acceptă toate setările sistemului și funcțiile majore
  • Cârlige ușoare pentru aplicații
  • Integrare cu File Explorer
  • Control vocal
  • Citirea ecranului și OCR

Inteligența artificială a devenit o parte importantă a strategiei Microsoft în ultimul an și ceva. Sigur, asta s-ar putea spune pentru multe companii, deoarece AI pare să fie cel mai tare cuvânt la modă în acest moment. Dar Microsoft a făcut recent pasul îndrăzneț de a-l aduce la Windows 11 In forma Windows Copilot, un nou asistent AI care este (neoficial) un succesor al lui Cortana. Este alimentat de modelul de limbă mare GPT-4 folosit în Bing Chat pentru a crea un instrument care speră să fie mai util ca niciodată.

În timp ce potențialul este interesant, implementarea actuală a Copilot în versiunile Windows Insider este foarte simplă și nu prea diferită de simpla utilizare Bing Chat

pe internet. Am câteva idei despre ce poate face Microsoft pentru a face din Copilot o parte cu adevărat esențială a Windows 11.

1 A sustine toate setările sistemului și funcțiile principale

Marea atracție cu Windows Copilot la lansare a fost că ar putea interacționa cu computerul în moduri în care Bing Chat, ca doar un browser, chiar nu ar putea. Și acesta este un punct de plecare excelent. Mulți utilizatori puternici le place deja să folosească interfețe bazate pe text și comenzi de la tastatură pentru a efectua anumite sarcini, așa că a putea schimba multe dintre aceste setări dintr-un singur loc are un potențial foarte mare.

Cu toate acestea, implementarea actuală acceptă doar câteva funcții, cum ar fi posibilitatea de a trece la modul deschis sau întunecat, activarea „Nu deranja” sau realizarea unei capturi de ecran. Acest lucru chiar trebuie să se extindă la toate setările Windows care pot fi găsite în aplicația Setări (Panoul de control ar trebui probabil să rămână în urmă în acest moment), sau cel puțin mult mai mult decât ceea ce avem acum. Ar putea schimba culoarea accentului, ar putea dezactiva unul dintre afișaje într-o configurație cu mai multe monitoare, ar putea schimba dispozitivele de redare și așa mai departe. Ar putea chiar să înceapă o sesiune de focalizare.

Dacă Windows Copilot ar putea ajuta cu toate acestea, ar putea face interacțiunea cu anumite setări mult mai rapidă, în special pentru persoanele care fac asta des. Sunt multe de făcut, iar Microsoft a promis o parte din ele, dar încă nu a livrat.

2 Cârlige ușoare pentru aplicații

Un alt lucru pe care îl simt că va face sau distruge utilitatea Copilot este integrarea sa cu alte aplicații. În spiritul de a deveni un asistent AI centralizat, Copilot trebuie să se poată integra cu ușurință cu tot felul de aplicații terțe. Am văzut acest lucru în acțiune când Microsoft a făcut demo-ul Copilot la Build de anul acesta și l-a folosit pentru a reda muzică cu Spotify. Dar nu am văzut că acest lucru a devenit funcțional încă și trebuie să depășească partenerii obișnuiți ai Microsoft.

Copilot ar trebui să poată deschide aplicații și să înceapă o anumită sarcină în cadrul acestora sau să reda o anumită emisiune pe Netflix sau orice altceva care ar putea fi util în aceste aplicații.

3 Integrare cu File Explorer

Știu că oamenii sunt probabil săturați de serviciile Microsoft nedorite oriunde se poate, dar cred că integrarea Copilot în File Explorer ar putea face acest lucru util pentru mai mult decât utilizatorii care doresc să tasteze instrucțiuni în Copilot, mai ales pentru că asta necesită ca fereastra Copilot să ocupe aproape spațiu pe ecran. in permanenta.

Ar putea fi interesant să aveți o funcție în File Explorer unde puteți face clic dreapta pe un fișier și alege o opțiune numită „Trimite la Copilot”, care i-ar cere apoi să întrebe ce vrei să faci cu spusele fişier. De exemplu, cu o imagine, ai putea cere lui Copilot să elimine fundalul sau i-ai putea cere să transcrie un fișier audio. Acestea sunt ambele capabilități pe care le-am văzut prezentate, dar, de obicei, ar trebui să trageți și să plasați fișierul în panoul Copilot. Cred că ar fi binevenit să îl poți accesa direct din File Explorer (dar și opțiunea de a-l dezactiva ar fi bună).

4 Control vocal

Bănuiesc că sunt singur în acesta, motiv pentru care l-am împins puțin pe acesta. Comenzile vocale sunt, evident, mai populare pe telefoane și, în acest moment, Bing Chat acceptă această funcție doar dacă ești pe telefon. Dar cred că ar fi bine să fie acceptate comenzile vocale laptopuri si PC-uri, de asemenea. Ar putea fi util să poți schimba toate aceste setări, să începi să redați muzică sau să deschideți o aplicație cu vocea. Și același lucru este valabil și pentru adresarea întrebărilor Bing. Cortana a susținut-o când a fost introdus Windows 11, iar Microsoft a vrut să fie un lucru mare, așa că nu sunt sigur dacă va câștiga de fapt multă tracțiune, dar pot vedea cu siguranță utilizări pentru el.

Cu un browser, trebuie să faceți din greu pentru a iniția interacțiunea vocală, dar cu o caracteristică încorporată, ați putea avea un cuvânt cheie de activare sau o comandă rapidă, astfel încât să puteți spune rapid dvs comenzi. Îmi imaginez că nu ar fi atât de greu de implementat, deoarece recunoașterea vocii este deja utilizată în mai multe părți ale Windows.

5 Citirea ecranului și OCR

Un ultim lucru pe care mi-ar plăcea să îl văd pe Copilot este să citească informațiile de pe ecran și, mai ales, recunoașterea optică a caracterelor (OCR). În acest moment, puteți cere Copilot să rezuma o pagină, dar trebuie să fie pe un site web deschis în Edge, ceea ce limitează sever funcționalitatea. În timp ce abordarea ideală ar fi să funcționeze în mod nativ cu alte browsere, ar fi interesant dacă Copilot ar putea acționează practic ca un cititor de ecran (cum ar fi Naratorul) și îl folosește pentru a extrage informații din orice pagină din orice browser sau aplicație pentru a rezumă-l.

O altă caracteristică interesantă ar fi OCR, sau abilitatea de a recunoaște textul din imagini, așa că ai putea cere Copilot să ia text dintr-o imagine sau dintr-o scanare PDF și pur și simplu să-l copieze sau să-l rezumă. Acesta nu este chiar atât de nebun, deoarece s-a raportat că este planificat un fel de capacitate OCR Windows 12, așa că sunt sigur că am putea vedea ceva în acest sens.

Există mai mult potențial neexploatat

Mi-am explorat aici preferințele și dorințele personale, dar cu ceva la fel de capabil ca Copilot și modelele mari de limbă care îl alimentează, sunt sigur că există mult mai multe idei pe care oamenii le-ar putea găsi utile. Oricum, viitorul Copilot și Windows este destul de interesant, presupunând că Microsoft poate îndeplini promisiunea acestui produs. Dacă asta se va întâmpla sau nu, este cu totul altă întrebare.