5 recursos que o AI Copilot do Windows 11 precisa para ser realmente útil

click fraud protection

O Copilot pode ser uma adição empolgante ao Windows 11, mas se a Microsoft deseja que seja valioso, precisa desses recursos.

Links Rápidos

  • Suporta todas as configurações do sistema e principais funções
  • Ganchos de aplicativos fáceis
  • Integração com Explorador de Arquivos
  • Controle de voz
  • Leitura de tela e OCR

A IA se tornou uma grande parte da estratégia da Microsoft no último ano. Claro, isso pode ser dito para muitas empresas, já que IA parece ser a palavra da moda no momento. Mas a Microsoft recentemente deu o passo ousado de trazê-lo para Windows 11 na forma de Copiloto do Windows, um novo assistente de IA que é (não oficialmente) um sucessor da Cortana. É alimentado pelo modelo de linguagem grande GPT-4 usado no Bing Chat para criar uma ferramenta que espera ser mais útil do que nunca.

Embora o potencial seja empolgante, a implementação atual do Copilot nas compilações do Windows Insider é muito básica e não muito diferente de apenas usar Bing Chat Na internet. Tenho algumas ideias sobre o que a Microsoft pode fazer para tornar o Copilot uma parte verdadeiramente essencial do Windows 11.

1 Apoiar todos configurações do sistema e principais funções

O grande atrativo do Windows Copilot no lançamento era que ele podia interagir com seu PC de maneiras que o Bing Chat, como apenas um navegador, realmente não conseguia. E este é um ótimo ponto de partida. Muitos usuários avançados já gostam de usar interfaces baseadas em texto e comandos de teclado para executar determinadas tarefas, portanto, poder alterar muitas dessas configurações de um só lugar tem muito potencial.

No entanto, a implementação atual suporta apenas alguns recursos, como poder mudar para o modo claro ou escuro, ativar o não perturbe ou tirar uma captura de tela. Isso realmente precisa se expandir para todos as configurações do Windows que podem ser encontradas no aplicativo Configurações (o Painel de Controle provavelmente deve ser deixado para trás neste ponto), ou pelo menos muito mais do que temos agora. Ele pode alterar a cor de destaque, desativar uma das exibições em uma configuração de vários monitores, alterar os dispositivos de reprodução e assim por diante. Pode até iniciar uma sessão de foco.

Se o Windows Copilot pudesse ajudar com tudo isso, poderia tornar a interação com certas configurações muito mais rápida, especialmente para pessoas que fazem isso com frequência. Há muito que pode ser feito, e a Microsoft prometeu algumas delas, mas ainda não entregou.

2 Ganchos de aplicativos fáceis

Outra coisa que acho que vai aumentar ou diminuir a utilidade do Copilot é sua integração com outros aplicativos. Com o espírito de se tornar um assistente de IA centralizado, o Copilot precisa ser capaz de se integrar facilmente a todos os tipos de aplicativos de terceiros. Nós meio que vimos isso em ação quando a Microsoft demonstrou o Copilot em construção deste ano e o usou para tocar música com o Spotify. Mas ainda não vimos isso se tornar funcional e precisa ir além dos parceiros habituais da Microsoft.

O Copilot deve ser capaz de abrir aplicativos e iniciar uma tarefa específica dentro deles, ou reproduzir um programa específico no Netflix ou qualquer outra coisa que possa ser útil nesses aplicativos.

3 Integração com Explorador de Arquivos

Eu sei que as pessoas provavelmente estão cansadas de a Microsoft calçar serviços indesejados sempre que possível, mas acho que ter a integração do Copilot no File Explorer pode torná-lo útil para mais do que apenas usuários que desejam digitar instruções no Copilot, especialmente porque isso requer que a janela do Copilot ocupe espaço na tela quase permanentemente.

Pode ser interessante ter um recurso no File Explorer onde você pode clicar com o botão direito do mouse em um arquivo e escolher uma opção chamada "Enviar para o copiloto", que solicitaria que ele perguntasse o que você deseja fazer com o dito arquivo. Por exemplo, com uma imagem, você pode pedir ao Copilot para remover o fundo ou pode pedir para transcrever um arquivo de áudio. Esses são os dois recursos que vimos mostrados, mas isso geralmente exigiria que você arrastasse e soltasse o arquivo no painel Copilot. Acho que poder acessá-lo diretamente do File Explorer seria bem-vindo (mas a opção de desativá-lo também seria boa).

4 Controle de voz

Suspeito que estou sozinho neste, e é por isso que o empurrei um pouco para baixo. Os comandos de voz são obviamente mais populares em telefones e, no momento, o Bing Chat só oferece suporte a esse recurso se você estiver no telefone. Mas acho que seria bom ter comandos de voz suportados em laptops e PCs também. Pode ser útil alterar todas essas configurações, começar a tocar música ou abrir um aplicativo com sua voz. E o mesmo vale para fazer perguntas ao Bing. A Cortana deu suporte quando o Windows 11 foi lançado, e a Microsoft queria que isso fosse uma grande coisa, então não tenho certeza se realmente ganharia muita força, mas posso definitivamente ver usos para isso.

Com um navegador, você precisa se esforçar um pouco para iniciar a interação por voz, mas com um recurso embutido, você pode ter uma palavra-chave de ativação ou atalho, para que você possa falar rapidamente comandos. Imagino que não seria tão difícil de implementar, pois o reconhecimento de voz já é usado em várias partes do Windows.

5 Leitura de tela e OCR

Uma última coisa que eu adoraria ver o Copilot ser capaz de fazer é ler as informações na tela e, principalmente, o reconhecimento óptico de caracteres (OCR). No momento, você pode pedir ao Copilot para resumir uma página, mas ela deve estar em um site aberto no Edge, o que limita bastante a funcionalidade. Embora a abordagem ideal seja fazer isso funcionar com outros navegadores nativamente, seria interessante se o Copilot pudesse basicamente atua como um leitor de tela (como o Narrador) e usa isso para extrair informações de qualquer página em qualquer navegador ou aplicativo para resumi-lo.

Outro recurso interessante seria o OCR, ou a capacidade de reconhecer texto em imagens, para que você pudesse pedir ao Copilot para pegar o texto de uma imagem ou digitalização de PDF e simplesmente copiá-lo ou resumir. Na verdade, este não é tão louco, pois foi relatado que algum tipo de recurso de OCR está planejado para Windows 12, então tenho certeza de que poderíamos ver algo nesse sentido.

Há mais potencial inexplorado

Eu explorei minhas preferências e desejos pessoais aqui, mas com algo tão capaz quanto o Copilot e os grandes modelos de linguagem que o alimentam, tenho certeza de que há muito mais ideias que as pessoas podem achar úteis. Independentemente disso, o futuro do Copilot e do Windows é bastante empolgante, supondo que a Microsoft possa cumprir a promessa deste produto. Se isso vai acontecer ou não, é uma outra questão.