Windows 11 の AI Copilot が本当に役立つために必要な 5 つの機能

Copilot は Windows 11 への魅力的な追加機能になる可能性がありますが、Microsoft がそれを価値のあるものにしたいのであれば、これらの機能が必要です。

クイックリンク

  • すべてのシステム設定と主要な機能をサポート
  • 簡単なアプリフック
  • ファイルエクスプローラーとの統合
  • 音声制御
  • 画面読み取りと OCR

AI はここ 1 年ほどでマイクロソフトの戦略の大きな部分を占めるようになりました。 確かに、AI は現在最もホットなバズワードのようですから、これは多くの企業に言えることでしょう。 しかし、マイクロソフトは最近、それを実現するという大胆な一歩を踏み出しました。 Windows 11 の形で Windows コパイロット、(非公式には)Cortana の後継となる新しい AI アシスタント。 これは、Bing Chat で使用される GPT-4 大型言語モデルを利用して、これまで以上に便利になるツールを作成しています。

可能性は刺激的ですが、Windows Insider ビルドでの Copilot の現在の実装は非常に基本的なものであり、単に使用することとそれほど変わりません。 Bing チャット ウェブ上で。 Copilot を Windows 11 の真に不可欠な部分にするために Microsoft ができることについて、いくつかのアイデアがあります。

1 サポート 全て システム設定と主な機能

Windows Copilot の発売時の大きな魅力は、単なるブラウザーである Bing Chat では実際にはできない方法で PC と対話できることでした。 そして、これは素晴らしい出発点です。 多くのパワー ユーザーは、テキスト ベースのインターフェイスやキーボード コマンドを使用して特定のタスクを実行することをすでに好んでいるため、これらの設定の多くを 1 か所から変更できることには、多くの可能性が秘められています。

ただし、現在の実装では、ライト モードまたはダーク モードへの変更、サイレント モードのオン、スクリーンショットの撮影など、いくつかの機能のみがサポートされています。 これは本当に拡張する必要があります 全て 設定アプリにある Windows の設定 (この時点ではコントロール パネルはおそらく残されるはずです)、または少なくとも現在あるものよりもはるかに多くのものです。 アクセントカラーを変更したり、マルチモニター設定でディスプレイの 1 つを無効にしたり、再生デバイスを変更したりすることができます。 集中セッションを開始することもできます。

Windows Copilot がこれらすべてを支援できれば、特に頻繁に設定を行うユーザーにとって、特定の設定の操作が大幅に高速化される可能性があります。 できることはたくさんあり、Microsoft はその一部を約束しましたが、まだ実現していません。

2 簡単なアプリフック

Copilot の有用性を左右するもう 1 つの点は、他のアプリとの統合です。 一元化された AI アシスタントになるという精神のもと、Copilot はあらゆる種類のサードパーティ アプリと簡単に統合できる必要があります。 Microsoft が Copilot をデモしたときに、これが実際に動作しているのを目にしました。 今年のビルド Spotify で音楽を再生するために使用しました。 しかし、それが機能するようになるのはまだ見ておらず、Microsoft の通常のパートナーを超える必要があります。

Copilot は、アプリを開いてその中で特定のタスクを開始したり、Netflix で特定の番組を再生したり、これらのアプリで役立つ可能性のある他のものを再生したりできる必要があります。

3 ファイルエクスプローラーとの統合

Microsoft が可能な限り不要なサービスを押しつけることに人々がおそらくうんざりしていることは承知していますが、ファイル エクスプローラーに Copilot を統合することでそれが実現できると思います。 Copilot で命令を入力したいユーザーだけでなく、特にそのためには Copilot ウィンドウが画面上のほとんどのスペースを占める必要があるため、便利です。 永久に。

ファイル エクスプローラーに、ファイルを右クリックして選択できる機能があると興味深いかもしれません。 「Send to Copilot」と呼ばれるオプション。これにより、そのメッセージをどのように処理するかを尋ねるメッセージが表示されます。 ファイル。 たとえば、画像の場合、Copilot に背景を削除するように依頼したり、音声ファイルを文字起こしするように依頼したりすることができます。 これらは両方とも私たちが披露した機能ですが、通常はファイルを [コパイロット] パネルにドラッグ アンド ドロップする必要があります。 ファイル エクスプローラーから直接アクセスできるのは歓迎だと思います (ただし、これをオフにするオプションもあれば便利だと思います)。

4 音声制御

この件については私が一人だと思うので、この件を少し押し下げた理由です。 音声コマンドは明らかに携帯電話での方が人気があり、現時点では、Bing Chat がこの機能をサポートしているのは携帯電話を使用している場合のみです。 でも、音声コマンドがサポートされていればいいのにと思います。 ラップトップ そしてPCも。 これらすべての設定を変更したり、音楽の再生を開始したり、音声でアプリを開いたりできると便利です。 Bing に質問する場合も同様です。 Cortana は Windows 11 の導入時にサポートしていましたし、Microsoft はそれを大きなこととして望んでいたので、実際に大きな注目を集めるかどうかはわかりませんが、その用途は間違いなくあります。

ブラウザの場合、音声対話を開始するには少し邪魔にならないようにする必要がありますが、 組み込み機能を使用すると、アクティベーション キーワードやショートカットを使用できるため、自分の言葉をすぐに話すことができます。 コマンド。 音声認識は Windows の複数の部分ですでに使用されているため、実装はそれほど難しくないと思います。

5 画面読み取りと OCR

最後に、Copilot にできるようにしてほしいのは、画面上の情報、特に光学式文字認識 (OCR) を読み取ることです。 現時点では、Copilot にページの要約を依頼できますが、それは Edge で開いている Web サイト上にある必要があるため、機能が大幅に制限されます。 理想的なアプローチは、これを他のブラウザでネイティブに動作させることですが、Copilot でそれが可能であれば興味深いでしょう。 基本的にスクリーン リーダー (ナレーターなど) として機能し、それを使用してブラウザまたはアプリのあらゆるページから情報を抽出します。 それを要約します。

もう 1 つの優れた機能は、OCR (画像内のテキストを認識する機能) です。これにより、Copilot に画像または PDF スキャンからテキストを取得して、単純にコピーしたり要約したりすることができます。 ある種の OCR 機能が計画されていると報告されているため、これは実際にはそれほどクレイジーではありません。 Windows 12, したがって、これらの線に沿って何かが見えると確信しています。

もっと未開発の可能性がある

ここでは私の個人的な好みや要望について検討しましたが、Copilot と同じくらい有能な機能と、それを支える大規模な言語モデルがあれば、人々が役立つと思われるアイデアがさらにたくさんあると確信しています。 いずれにしても、Microsoft がこの製品の約束を果たすことができれば、Copilot と Windows の将来は非常にエキサイティングです。 それが実際に起こるかどうかは、まったく別の問題です。