Copilot יכול להיות תוספת מרגשת ל-Windows 11, אבל אם מיקרוסופט רוצה שזה יהיה בעל ערך, היא צריכה את היכולות האלה.
קישורים מהירים
- תמיכה בכל הגדרות המערכת והפונקציות העיקריות
- ווים לאפליקציה קלים
- אינטגרציה עם סייר הקבצים
- שליטה קולית
- קריאת מסך ו-OCR
בינה מלאכותית הפכה לחלק עצום מהאסטרטגיה של מיקרוסופט במהלך השנה האחרונה בערך. בטח, אפשר לומר את זה על חברות רבות, מכיוון שנראה כי AI היא מילת הבאז החמה ביותר כרגע. אבל מיקרוסופט נקטה לאחרונה בצעד הנועז להביא את זה Windows 11 בצורה של Windows Copilot, עוזר AI חדש שהוא (באופן לא רשמי) יורש של Cortana. הוא מופעל על ידי מודל השפה הגדול GPT-4 המשמש n Bing Chat כדי ליצור כלי שמקווה להיות שימושי מתמיד.
למרות שהפוטנציאל מרגש, היישום הנוכחי של Copilot ב-Windows Insider builds הוא בסיסי מאוד ולא שונה מדי משימוש בינג צ'אט ברשת. יש לי כמה רעיונות למה שמיקרוסופט יכולה לעשות כדי להפוך את Copilot לחלק חיוני באמת של Windows 11.
1 תמיכה את כל הגדרות מערכת ופונקציות עיקריות
המשיכה הגדולה של Windows Copilot בעת ההשקה הייתה שהוא יכול לקיים אינטראקציה עם המחשב האישי שלך בדרכים ש-Bing Chat, כדפדפן בלבד, באמת לא הצליח. וזו נקודת התחלה מצוינת. משתמשי כוח רבים כבר אוהבים להשתמש בממשקים מבוססי טקסט ובפקודות מקלדת לביצוע משימות מסוימות, כך שליכולת לשנות הרבה מההגדרות הללו ממקום אחד יש פוטנציאל רב.
עם זאת, היישום הנוכחי תומך רק בכמה תכונות, כמו היכולת לעבור למצב בהיר או כהה, להפעיל את 'נא לא להפריע' או לצלם צילום מסך. זה באמת צריך להתרחב את כל את הגדרות Windows שניתן למצוא באפליקציית ההגדרות (כנראה שלוח הבקרה אמור להישאר מאחור בשלב זה), או לפחות הרבה יותר ממה שיש לנו כרגע. זה יכול לשנות את צבע המבטא, להשבית את אחת התצוגות בהגדרה מרובה צגים, לשנות התקני השמעה וכן הלאה. זה יכול אפילו להתחיל מפגש מיקוד.
אם Windows Copilot יכול לעזור עם כל זה, זה יכול להפוך את האינטראקציה עם הגדרות מסוימות למהיר הרבה יותר, במיוחד עבור אנשים שעושים זאת לעתים קרובות. יש הרבה מה לעשות, ומיקרוסופט הבטיחה חלק מזה, אבל זה עדיין לא קיים.
2 ווים לאפליקציה קלים
דבר נוסף שלדעתי יעשה או ישבור את התועלת של Copilot הוא השילוב שלו עם אפליקציות אחרות. ברוח הפיכתו לעוזר AI מרכזי, Copilot צריך להיות מסוגל להשתלב בקלות עם כל מיני אפליקציות של צד שלישי. די ראינו את זה בפעולה כשמיקרוסופט הדגימה את Copilot ב ה-Build של השנה והשתמש בו כדי להשמיע מוזיקה עם Spotify. אבל עדיין לא ראינו את זה הופך לפונקציונלי, וזה צריך לחרוג מהשותפים הרגילים של מיקרוסופט.
Copilot אמור להיות מסוגל לפתוח אפליקציות ולהתחיל משימה ספציפית בתוכם, או להפעיל תוכנית ספציפית בנטפליקס, או כל דבר אחר שעשוי להיות שימושי באפליקציות הללו.
3 אינטגרציה עם סייר הקבצים
אני יודע שכנראה שאנשים עייפים ועייפים ממיקרוסופט נועלת שירותים לא רצויים בכל מקום שהיא יכולה, אבל אני חושב ששילוב Copilot בסייר הקבצים יכול לעשות את זה שימושי עבור יותר מסתם משתמשים שרוצים להקליד הוראות ב-Copilot, במיוחד כי זה דורש שחלון Copilot תופס מקום כמעט על המסך שלך לִצְמִיתוּת.
יכול להיות מעניין שתהיה לך תכונה בסייר הקבצים שבה תוכל ללחוץ לחיצה ימנית על קובץ ולבחור אפשרות שנקראת "שלח ל-Copilot", אשר תנחה אותו לשאול מה אתה רוצה לעשות עם האמור קוֹבֶץ. לדוגמה, עם תמונה, אתה יכול לבקש מ-Copilot להסיר את הרקע, או שאתה יכול לבקש ממנו לתמלל קובץ שמע. אלו הן היכולות שראינו, אבל זה בדרך כלל יחייב אותך לגרור ולשחרר את הקובץ לחלונית Copilot. אני חושב שהאפשרות לגשת אליו ישירות מסייר הקבצים תתקבל בברכה (אבל גם האפשרות לכבות אותו תהיה נחמדה).
4 שליטה קולית
אני חושד שאני לבד בקטע הזה, וזו הסיבה שדחפתי את זה קצת למטה. ברור שפקודות קוליות פופולריות יותר בטלפונים, וכרגע, Bing Chat תומך בתכונה זו רק אם אתה בטלפון שלך. אבל אני חושב שזה יהיה נחמד לקבל תמיכה בפקודות קוליות מחשבים ניידים וגם מחשבים אישיים. היכולת לשנות את כל ההגדרות האלה, להתחיל לנגן מוזיקה או לפתוח אפליקציה עם הקול שלך יכולה להיות שימושית. וזה נכון לגבי שאילת שאלות בינג. Cortana אכן תמכה בו כאשר חלונות 11 הוצגה, ומיקרוסופט רצתה שזה יהיה דבר גדול, אז אני לא בטוח אם זה באמת יקבל הרבה אחיזה, אבל אני בהחלט יכול לראות שימושים בזה.
עם דפדפן, אתה צריך ללכת קצת מגדרך כדי ליזום אינטראקציה קולית, אבל עם א תכונה מובנית, תוכל לקבל מילת מפתח או קיצור דרך להפעלה, כדי שתוכל לדבר במהירות שלך פקודות. אני מתאר לעצמי שזה לא יהיה כל כך קשה ליישום מכיוון שכבר נעשה שימוש בזיהוי קולי בחלקים מרובים של Windows.
5 קריאת מסך ו-OCR
דבר אחרון שאשמח לראות את Copilot מסוגל לעשות הוא לקרוא את המידע על המסך, ובמיוחד, זיהוי תווים אופטי (OCR). נכון לעכשיו, אתה יכול לבקש מ-Copilot לסכם דף, אבל זה חייב להיות באתר פתוח ב-Edge, מה שמגביל מאוד את הפונקציונליות. בעוד שהגישה האידיאלית תהיה לעבוד עם דפדפנים אחרים באופן מקורי, זה יהיה מעניין אם Copilot יוכל בעצם לפעול כקורא מסך (כגון Narrator) ולהשתמש בו כדי לחלץ מידע מכל דף בכל דפדפן או אפליקציה כדי לסכם את זה.
תכונה מגניבה נוספת תהיה OCR, או היכולת לזהות טקסט בתמונות, כך שתוכל לבקש מ-Copilot לתפוס טקסט מתמונה או מסריקת PDF, ופשוט להעתיק אותו או לסכם אותו. זה למעשה לא כל כך מטורף מכיוון שדווח שמתוכננת איזושהי יכולת OCR Windows 12, אז אני בטוח שנוכל לראות משהו בסגנון הזה.
יש עוד פוטנציאל שלא מנוצל
חקרתי כאן את ההעדפות והרצונות האישיים שלי, אבל עם משהו כל כך מסוגל כמו Copilot ומודלי השפה הגדולים שמחזקים אותו, אני בטוח שיש עוד הרבה רעיונות שאנשים יכולים למצוא בהם שימושיים. בלי קשר, העתיד של Copilot ו-Windows הוא די מרגש, בהנחה שמיקרוסופט תוכל לקיים את ההבטחה של המוצר הזה. האם זה אכן יקרה או לא זו שאלה אחרת לגמרי.