5 funkcje AI Copilot systemu Windows 11 muszą być naprawdę przydatne

Copilot może być ekscytującym dodatkiem do systemu Windows 11, ale jeśli Microsoft chce, aby był wartościowy, potrzebuje tych możliwości.

Szybkie linki

  • Obsługuje wszystkie ustawienia systemowe i główne funkcje
  • Łatwe zaczepy do aplikacji
  • Integracja z Eksploratorem plików
  • Kontrola głosu
  • Odczyt ekranu i OCR

Sztuczna inteligencja stała się ogromną częścią strategii Microsoftu w ciągu ostatniego roku. Jasne, można to powiedzieć o wielu firmach, ponieważ sztuczna inteligencja wydaje się być obecnie najgorętszym hasłem. Ale Microsoft niedawno podjął śmiały krok, aby go wprowadzić Okna 11 w formie Drugi pilot systemu Windows, nowy asystent AI, który (nieoficjalnie) jest następcą Cortany. Jest zasilany przez duży model językowy GPT-4 używany w Bing Chat do stworzenia narzędzia, które ma być bardziej przydatne niż kiedykolwiek.

Chociaż potencjał jest ekscytujący, obecna implementacja Copilot w kompilacjach Windows Insider jest bardzo prosta i nie różni się zbytnio od zwykłego używania Czat Binga w Internecie. Mam kilka pomysłów na to, co Microsoft może zrobić, aby Copilot stał się naprawdę istotną częścią systemu Windows 11.

1 Wsparcie Wszystko ustawienia systemowe i główne funkcje

Wielką zaletą Windows Copilot w momencie premiery było to, że mógł on wchodzić w interakcje z komputerem w sposób, w jaki Bing Chat, jako zwykła przeglądarka, naprawdę nie mógł. I to jest świetny punkt wyjścia. Wielu zaawansowanych użytkowników już lubi używać interfejsów tekstowych i poleceń klawiaturowych do wykonywania określonych zadań, więc możliwość zmiany wielu tych ustawień z jednego miejsca ma duży potencjał.

Jednak obecna implementacja obsługuje tylko kilka funkcji, takich jak możliwość przejścia do trybu jasnego lub ciemnego, włączenia trybu „nie przeszkadzać” lub zrobienia zrzutu ekranu. To naprawdę musi się rozwinąć Wszystko ustawienia systemu Windows, które można znaleźć w aplikacji Ustawienia (panel sterowania prawdopodobnie powinien zostać w tym momencie pozostawiony w tyle), a przynajmniej znacznie więcej niż to, co mamy teraz. Może zmienić kolor akcentu, wyłączyć jeden z wyświetlaczy w konfiguracji z wieloma monitorami, zmienić urządzenia odtwarzające i tak dalej. Może nawet rozpocząć sesję fokusową.

Jeśli Windows Copilot może w tym wszystkim pomóc, może znacznie przyspieszyć interakcję z niektórymi ustawieniami, szczególnie dla osób, które często to robią. Jest wiele rzeczy, które można zrobić, a Microsoft obiecał część z nich, ale jeszcze tego nie zrobił.

2 Łatwe zaczepy do aplikacji

Inną rzeczą, która moim zdaniem wpłynie na przydatność Copilot, jest jego integracja z innymi aplikacjami. W duchu stania się scentralizowanym asystentem AI, Copilot musi mieć możliwość łatwej integracji ze wszystkimi rodzajami aplikacji innych firm. Widzieliśmy to w akcji, kiedy Microsoft zaprezentował Copilot na tegoroczna budowa i używałem go do odtwarzania muzyki za pomocą Spotify. Ale nie widzieliśmy jeszcze, żeby stało się to funkcjonalne i musi wyjść poza zwykłych partnerów Microsoftu.

Copilot powinien być w stanie otwierać aplikacje i uruchamiać w nich określone zadania lub odtwarzać określony program w serwisie Netflix lub cokolwiek innego, co może być przydatne w tych aplikacjach.

3 Integracja z Eksploratorem plików

Wiem, że ludzie są prawdopodobnie chorzy i zmęczeni tym, że Microsoft podkuwa niechciane usługi, gdzie tylko się da, ale myślę, że integracja Copilot w Eksploratorze plików mogłaby to zrobić przydatne nie tylko dla użytkowników, którzy chcą wpisywać instrukcje w Copilot, zwłaszcza że wymaga to, aby okno Copilot zajmowało prawie całe miejsce na ekranie na stałe.

Interesujące może być posiadanie funkcji w Eksploratorze plików, w której można kliknąć plik prawym przyciskiem myszy i wybrać opcja o nazwie „Wyślij do drugiego pilota”, która następnie skłoniłaby go do zapytania, co chcesz z tym zrobić plik. Na przykład w przypadku obrazu możesz poprosić Copilota o usunięcie tła lub o transkrypcję pliku audio. Są to obie możliwości, które pokazaliśmy, ale zwykle wymagałoby to przeciągnięcia i upuszczenia pliku do panelu Copilot. Myślę, że mile widziany byłby dostęp do niego bezpośrednio z Eksploratora plików (ale opcja wyłączenia też byłaby fajna).

4 Kontrola głosu

Podejrzewam, że jestem w tym osamotniony, dlatego trochę go obniżyłem. Polecenia głosowe są oczywiście bardziej popularne na telefonach, a obecnie Bing Chat obsługuje tę funkcję tylko wtedy, gdy korzystasz z telefonu. Ale myślę, że fajnie byłoby mieć włączone polecenia głosowe laptopy i PC też. Możliwość zmiany wszystkich tych ustawień, rozpoczęcia odtwarzania muzyki lub otwarcia aplikacji za pomocą głosu może być przydatna. To samo dotyczy zadawania pytań Bing. Cortana obsługiwała go, gdy wprowadzono system Windows 11, a Microsoft chciał, żeby to była wielka rzecz, więc nie jestem pewien, czy rzeczywiście zyskałby dużą przyczepność, ale zdecydowanie widzę dla niego zastosowania.

W przypadku przeglądarki musisz trochę zejść z drogi, aby zainicjować interakcję głosową, ale z wbudowana funkcja, możesz mieć aktywacyjne słowo kluczowe lub skrót, dzięki czemu możesz szybko mówić polecenia. Wyobrażam sobie, że nie byłoby to trudne do wdrożenia, ponieważ rozpoznawanie głosu jest już używane w wielu częściach systemu Windows.

5 Odczyt ekranu i OCR

Ostatnią rzeczą, którą chciałbym zobaczyć w Copilot, jest odczytywanie informacji na ekranie, a zwłaszcza optyczne rozpoznawanie znaków (OCR). W tej chwili możesz poprosić Copilot o podsumowanie strony, ale musi to być witryna otwarta w Edge, co poważnie ogranicza funkcjonalność. Chociaż idealnym podejściem byłoby natywne działanie tej funkcji z innymi przeglądarkami, byłoby interesujące, gdyby Copilot mógł zasadniczo działać jako czytnik ekranu (taki jak Narrator) i używać go do wyodrębniania informacji z dowolnej strony w dowolnej przeglądarce lub aplikacji do streścić to.

Kolejną fajną funkcją byłby OCR, czyli zdolność rozpoznawania tekstu na obrazach, więc możesz poprosić Copilot o pobranie tekstu z obrazu lub skanu PDF i po prostu skopiowanie go lub podsumowanie. Ten w rzeczywistości nie jest taki szalony, ponieważ zgłoszono, że planowana jest jakaś funkcja OCR Okna 12, więc jestem pewien, że moglibyśmy zobaczyć coś w tym stylu.

Jest większy niewykorzystany potencjał

Zbadałem tutaj moje osobiste preferencje i życzenia, ale z czymś tak zdolnym jak Copilot i dużymi modelami językowymi, które go napędzają, jestem pewien, że jest o wiele więcej pomysłów, które ludzie mogą uznać za przydatne. Niezależnie od tego, przyszłość Copilot i Windows jest dość ekscytująca, zakładając, że Microsoft może dotrzymać obietnicy tego produktu. To, czy tak się rzeczywiście stanie, to zupełnie inna kwestia.