5 funzionalità AI Copilot di Windows 11 deve essere veramente utile

click fraud protection

Copilot potrebbe essere un'entusiasmante aggiunta a Windows 11, ma se Microsoft vuole che sia prezioso, ha bisogno di queste funzionalità.

Link veloci

  • Supporta tutte le impostazioni di sistema e le principali funzioni
  • Ganci app facili
  • Integrazione con Esplora file
  • Controllo vocale
  • Lettura dello schermo e OCR

L'intelligenza artificiale è diventata una parte enorme della strategia di Microsoft nell'ultimo anno o giù di lì. Certo, questo si potrebbe dire per molte aziende, poiché AI sembra essere la parola d'ordine più in voga in questo momento. Ma Microsoft ha recentemente compiuto il passo coraggioso di portarlo a Finestre 11 nella forma di Copilota di Windows, un nuovo assistente AI che è (ufficiosamente) un successore di Cortana. È alimentato dal modello di linguaggio di grandi dimensioni GPT-4 utilizzato in Bing Chat per creare uno strumento che spera di essere più utile che mai.

Sebbene il potenziale sia entusiasmante, l'attuale implementazione di Copilot nelle build di Windows Insider è molto semplice e non troppo diversa dal semplice utilizzo

Chat di Bing In rete. Ho alcune idee su ciò che Microsoft può fare per rendere Copilot una parte davvero essenziale di Windows 11.

1 Supporto Tutto impostazioni di sistema e funzioni principali

La grande attrazione di Windows Copilot al momento del lancio era che poteva interagire con il tuo PC in modi che Bing Chat, in quanto semplice browser, non poteva davvero. E questo è un ottimo punto di partenza. A molti utenti esperti piace già utilizzare interfacce basate su testo e comandi da tastiera per eseguire determinate attività, quindi poter modificare molte di queste impostazioni da un'unica posizione ha un grande potenziale.

Tuttavia, l'attuale implementazione supporta solo alcune funzionalità, come la possibilità di passare alla modalità chiara o scura, attivare la modalità Non disturbare o acquisire uno screenshot. Questo ha davvero bisogno di espandersi Tutto le impostazioni di Windows che possono essere trovate nell'app Impostazioni (il Pannello di controllo dovrebbe probabilmente essere lasciato indietro a questo punto), o almeno molto di più di quello che abbiamo adesso. Potrebbe cambiare il colore dell'accento, disabilitare uno dei display in una configurazione multi-monitor, cambiare i dispositivi di riproduzione e così via. Potrebbe anche iniziare una sessione di focus.

Se Windows Copilot potesse aiutare con tutto questo, potrebbe rendere l'interazione con determinate impostazioni molto più veloce, specialmente per le persone che lo fanno frequentemente. C'è molto che si può fare e Microsoft ne ha promesso una parte, ma non l'ha ancora consegnata.

2 Ganci app facili

Un'altra cosa che ritengo possa creare o distruggere l'utilità di Copilot è la sua integrazione con altre app. Nello spirito di diventare un assistente AI centralizzato, Copilot deve essere in grado di integrarsi facilmente con tutti i tipi di app di terze parti. Lo abbiamo visto in azione quando Microsoft ha presentato Copilot a Build di quest'anno e l'ho usato per riprodurre musica con Spotify. Ma non l'abbiamo ancora visto diventare funzionale e deve andare oltre i soliti partner di Microsoft.

Copilot dovrebbe essere in grado di aprire app e avviare un'attività specifica al loro interno o riprodurre uno spettacolo specifico su Netflix o qualsiasi altra cosa che potrebbe essere utile in queste app.

3 Integrazione con Esplora file

So che le persone sono probabilmente malate e stanche di Microsoft che mette a disposizione servizi indesiderati ovunque possibile, ma penso che avere l'integrazione di Copilot in Esplora file potrebbe farcela utile per più di semplici utenti che desiderano digitare le istruzioni in Copilot, soprattutto perché ciò richiede che la finestra di Copilot occupi quasi spazio sullo schermo permanentemente.

Potrebbe essere interessante avere una funzionalità in Esplora file in cui è possibile fare clic con il pulsante destro del mouse su un file e scegliere un'opzione chiamata "Invia a copilota", che quindi richiederebbe di chiedere cosa vuoi fare con detto file. Ad esempio, con un'immagine, puoi chiedere a Copilot di rimuovere lo sfondo oppure puoi chiedergli di trascrivere un file audio. Queste sono entrambe le funzionalità che abbiamo visto in mostra, ma che di solito richiederebbero di trascinare e rilasciare il file nel pannello Copilot. Penso che essere in grado di accedervi direttamente da Esplora file sarebbe il benvenuto (ma anche l'opzione per disattivarlo sarebbe utile).

4 Controllo vocale

Sospetto di essere solo in questo, motivo per cui l'ho abbassato un po'. I comandi vocali sono ovviamente più popolari sui telefoni e, al momento, Bing Chat supporta questa funzione solo se sei al telefono. Ma penso che sarebbe bello avere i comandi vocali supportati laptop e anche i PC. Potrebbe essere utile poter modificare tutte queste impostazioni, avviare la riproduzione di musica o aprire un'app con la voce. E lo stesso vale per fare domande a Bing. Cortana lo ha supportato quando è stato introdotto Windows 11 e Microsoft voleva che fosse una cosa importante, quindi non sono sicuro che avrebbe effettivamente guadagnato molta trazione, ma posso sicuramente vederne gli usi.

Con un browser, devi fare un po' di strada per avviare l'interazione vocale, ma con un funzionalità integrata, potresti avere una parola chiave o un collegamento di attivazione, in modo da poter pronunciare rapidamente il tuo comandi. Immagino che non sarebbe così difficile da implementare poiché il riconoscimento vocale è già utilizzato in più parti di Windows.

5 Lettura dello schermo e OCR

Un'ultima cosa che mi piacerebbe vedere Copilot fosse in grado di fare è leggere le informazioni sullo schermo e, in particolare, il riconoscimento ottico dei caratteri (OCR). In questo momento, puoi chiedere a Copilot di riepilogare una pagina, ma deve trovarsi su un sito Web aperto in Edge, il che limita fortemente la funzionalità. Sebbene l'approccio ideale sarebbe che questo funzioni con altri browser in modo nativo, sarebbe interessante se Copilot potesse farlo fondamentalmente agisce come un lettore di schermo (come Narratore) e lo usa per estrarre informazioni da qualsiasi pagina su qualsiasi browser o app per riassumerlo.

Un'altra caratteristica interessante sarebbe l'OCR, o la capacità di riconoscere il testo nelle immagini, quindi potresti chiedere a Copilot di estrarre il testo da un'immagine o da una scansione PDF e semplicemente copiarlo o riassumerlo. Questo in realtà non è così folle poiché è stato riferito che è prevista una sorta di funzionalità OCR Finestre 12, quindi sono sicuro che potremmo vedere qualcosa in questo senso.

C'è più potenziale non sfruttato

Ho esplorato le mie preferenze e i miei desideri personali qui, ma con qualcosa di così capace come Copilot e i grandi modelli linguistici che lo alimentano, sono sicuro che ci sono molte più idee che le persone potrebbero trovare utili. Indipendentemente da ciò, il futuro di Copilot e Windows è piuttosto entusiasmante, supponendo che Microsoft possa mantenere la promessa di questo prodotto. Se ciò accadrà o meno è tutta un'altra questione.