5 функций AI Copilot в Windows 11, которые должны быть действительно полезными

Copilot может стать интересным дополнением к Windows 11, но если Microsoft хочет, чтобы оно было ценным, ей нужны эти возможности.

Быстрые ссылки

  • Поддержка всех системных настроек и основных функций
  • Легкие крючки приложений
  • Интеграция с проводником
  • Голосовое управление
  • Чтение экрана и OCR

ИИ стал важной частью стратегии Microsoft за последний год или около того. Конечно, это можно сказать о многих компаниях, поскольку сейчас ИИ кажется самым модным словечком. Но Microsoft недавно предприняла смелый шаг, доведя его до Windows 11 в виде Второй пилот Windows, нового помощника искусственного интеллекта, который (неофициально) является преемником Cortana. Он основан на большой языковой модели GPT-4 и использует Bing Chat для создания инструмента, который надеется стать еще более полезным, чем когда-либо.

Хотя потенциал впечатляет, текущая реализация Copilot в сборках Windows Insider очень проста и не слишком отличается от простого использования Бинг-чат В интернете. У меня есть несколько идей о том, что может сделать Microsoft, чтобы сделать Copilot действительно важной частью Windows 11.

1 Поддерживать все системные настройки и основные функции

Большим преимуществом Windows Copilot при запуске было то, что он мог взаимодействовать с вашим ПК так, как Bing Chat, как обычный браузер, на самом деле не мог. И это отличная отправная точка. Многим опытным пользователям уже нравится использовать текстовые интерфейсы и команды клавиатуры для выполнения определенных задач, поэтому возможность изменять множество этих настроек из одного места имеет большой потенциал.

Однако текущая реализация поддерживает только несколько функций, таких как возможность перехода в светлый или темный режим, включение режима «Не беспокоить» или создание снимка экрана. Это действительно нужно расширить до все настройки Windows, которые можно найти в приложении «Настройки» (на данный момент, вероятно, следует оставить панель управления), или, по крайней мере, гораздо больше, чем то, что у нас есть прямо сейчас. Это может изменить цвет акцента, отключить один из дисплеев в настройке с несколькими мониторами, изменить устройства воспроизведения и так далее. Это может даже начать фокус-сессию.

Если бы Windows Copilot мог помочь со всем этим, он мог бы значительно ускорить взаимодействие с некоторыми настройками, особенно для людей, которые делают это часто. Многое можно сделать, и Microsoft пообещала кое-что из этого, но еще не выполнила.

2 Легкие крючки приложений

Еще одна вещь, которая, как мне кажется, сделает или сломает полезность Copilot, — это его интеграция с другими приложениями. Чтобы стать централизованным помощником по искусственному интеллекту, Copilot должен иметь возможность легко интегрироваться со всеми видами сторонних приложений. Мы видели это в действии, когда Microsoft демонстрировала Copilot на сборка этого года и использовал его для воспроизведения музыки с помощью Spotify. Но мы еще не видели, чтобы это стало функциональным, и это должно выйти за рамки обычных партнеров Microsoft.

Второй пилот должен иметь возможность открывать приложения и запускать в них определенную задачу, воспроизводить определенное шоу на Netflix или делать что-то еще, что может быть полезно в этих приложениях.

3 Интеграция с проводником

Я знаю, что люди, вероятно, устали от того, что Microsoft использует нежелательные службы везде, где это возможно, но я думаю, что интеграция Copilot в File Explorer могла бы помочь. полезно не только для пользователей, которые хотят вводить инструкции в Copilot, особенно потому, что для этого требуется, чтобы окно Copilot почти занимало место на экране. постоянно.

Было бы интересно иметь в Проводнике функцию, позволяющую щелкнуть файл правой кнопкой мыши и выбрать опция под названием «Отправить второму пилоту», которая затем предложит ему спросить, что вы хотите сделать с указанным файл. Например, с изображением вы можете попросить Copilot удалить фон или расшифровать аудиофайл. Обе эти возможности мы видели продемонстрированными, но обычно для этого требуется перетащить файл на панель Copilot. Я думаю, что возможность доступа к нему непосредственно из проводника будет приветствоваться (но возможность отключить его тоже будет неплохо).

4 Голосовое управление

Я подозреваю, что я один в этом, поэтому я немного отодвинул это. Голосовые команды, очевидно, более популярны на телефонах, и прямо сейчас Bing Chat поддерживает эту функцию только в том случае, если вы используете свой телефон. Но я думаю, что было бы неплохо иметь поддержку голосовых команд на ноутбуки и ПК тоже. Возможность изменить все эти настройки, начать воспроизводить музыку или открыть приложение с помощью голоса может быть полезной. И то же самое касается вопросов, задаваемых Bing. Cortana действительно поддерживала его, когда была представлена ​​Windows 11, и Microsoft хотела, чтобы это стало большим событием, поэтому я не уверен, что это на самом деле получит большую популярность, но я определенно вижу для него применение.

В браузере вам придется немного постараться, чтобы инициировать голосовое взаимодействие, но с встроенной функции, у вас может быть ключевое слово или ярлык активации, чтобы вы могли быстро произнести свой команды. Я полагаю, это будет несложно реализовать, поскольку распознавание голоса уже используется во многих частях Windows.

5 Чтение экрана и OCR

Последнее, что мне бы хотелось, чтобы Copilot мог делать, это читать информацию на экране и, особенно, оптическое распознавание символов (OCR). Прямо сейчас вы можете попросить Copilot обобщить страницу, но она должна быть на веб-сайте, открытом в Edge, что сильно ограничивает функциональность. Хотя идеальным подходом было бы нативное взаимодействие с другими браузерами, было бы интересно, если бы Copilot мог в основном действует как средство чтения с экрана (например, Экранный диктор) и использует его для извлечения информации с любой страницы в любом браузере или приложении для обобщить его.

Еще одной интересной функцией будет OCR или возможность распознавать текст на изображениях, поэтому вы можете попросить Copilot взять текст с изображения или отсканированного PDF-файла и просто скопировать его или обобщить. Это на самом деле не так уж и безумно, поскольку сообщалось, что для него запланирована какая-то возможность OCR. Windows 12, поэтому я уверен, что мы могли бы увидеть что-то в этом роде.

Есть еще неиспользованный потенциал

Я изучил здесь свои личные предпочтения и пожелания, но с чем-то столь же функциональным, как Copilot, и большими языковыми моделями, которые его поддерживают, я уверен, что люди могут найти гораздо больше идей, которые могут быть полезными. Несмотря на это, будущее Copilot и Windows довольно захватывающее, если Microsoft сможет выполнить обещание этого продукта. Произойдет ли это на самом деле, это уже другой вопрос.