ฟีเจอร์ 5 ประการ AI Copilot ของ Windows 11 จำเป็นต้องมีประโยชน์อย่างแท้จริง

Copilot อาจเป็นส่วนเสริมที่น่าตื่นเต้นสำหรับ Windows 11 แต่ถ้า Microsoft ต้องการให้มีคุณค่า ก็ต้องการความสามารถเหล่านี้

ลิงค์ด่วน

  • รองรับการตั้งค่าระบบและฟังก์ชั่นหลักทั้งหมด
  • ขอแอพง่าย ๆ
  • การรวมเข้ากับ File Explorer
  • การควบคุมด้วยเสียง
  • การอ่านหน้าจอและ OCR

AI ได้กลายเป็นส่วนสำคัญของกลยุทธ์ของ Microsoft ในช่วงปีที่ผ่านมา แน่นอนว่าหลายบริษัทอาจพูดแบบนั้นได้ เพราะ AI ดูเหมือนจะเป็นคำที่ฮอตฮิตที่สุดในตอนนี้ แต่เมื่อเร็ว ๆ นี้ Microsoft ได้ก้าวไปสู่ขั้นตอนที่กล้าหาญ วินโดวส์ 11 ในรูปแบบของ Windows Copilotผู้ช่วย AI คนใหม่ซึ่งเป็นผู้สืบทอดของ Cortana (อย่างไม่เป็นทางการ) ขับเคลื่อนโดยโมเดลภาษาขนาดใหญ่ GPT-4 ที่ใช้ n Bing Chat เพื่อสร้างเครื่องมือที่หวังว่าจะมีประโยชน์มากกว่าที่เคย

แม้ว่าศักยภาพจะน่าตื่นเต้น แต่การใช้งาน Copilot ใน Windows Insider builds ในปัจจุบันนั้นพื้นฐานมากและไม่แตกต่างจากการใช้ บิงแชต บนเว็บ ฉันมีแนวคิดบางอย่างเกี่ยวกับสิ่งที่ Microsoft สามารถทำได้เพื่อให้ Copilot เป็นส่วนสำคัญอย่างแท้จริงของ Windows 11

1 สนับสนุน ทั้งหมด การตั้งค่าระบบและฟังก์ชั่นหลัก

จุดเด่นที่สำคัญของ Windows Copilot เมื่อเปิดตัวคือมันสามารถโต้ตอบกับพีซีของคุณในแบบที่ Bing Chat ซึ่งเป็นเพียงเบราว์เซอร์ทำไม่ได้จริงๆ และนี่คือจุดเริ่มต้นที่ดี ผู้ใช้ขั้นสูงจำนวนมากชอบใช้อินเทอร์เฟซแบบข้อความและคำสั่งแป้นพิมพ์เพื่อทำงานบางอย่างอยู่แล้ว ดังนั้นการที่จะเปลี่ยนแปลงการตั้งค่าเหล่านี้จำนวนมากจากที่เดียวจึงมีความเป็นไปได้สูง

อย่างไรก็ตาม การใช้งานในปัจจุบันรองรับฟีเจอร์บางอย่างเท่านั้น เช่น สามารถเปลี่ยนโหมดสว่างหรือมืด เปิดโหมดห้ามรบกวน หรือถ่ายภาพหน้าจอ สิ่งนี้จำเป็นต้องขยายไปที่ ทั้งหมด การตั้งค่า Windows ที่สามารถพบได้ในแอปการตั้งค่า (แผงควบคุมควรจะถูกทิ้งไว้ ณ จุดนี้) หรืออย่างน้อยก็มากกว่าที่เรามีในตอนนี้ มันสามารถเปลี่ยนสีที่เน้นเสียง ปิดการใช้งานหนึ่งในจอแสดงผลในการตั้งค่าหลายจอภาพ เปลี่ยนอุปกรณ์การเล่น และอื่นๆ มันสามารถเริ่มเซสชั่นโฟกัสได้

หาก Windows Copilot สามารถช่วยทั้งหมดนี้ได้ ก็อาจทำให้การโต้ตอบกับการตั้งค่าบางอย่างเร็วขึ้นมาก โดยเฉพาะอย่างยิ่งสำหรับผู้ที่ทำสิ่งนั้นบ่อยๆ มีหลายอย่างที่สามารถทำได้ และ Microsoft ได้สัญญาไว้บางส่วน แต่ยังไม่ได้ส่งมอบ

2 ขอแอพง่าย ๆ

อีกสิ่งหนึ่งที่ฉันรู้สึกว่าจะสร้างหรือทำลายประโยชน์ของ Copilot ก็คือการรวมเข้ากับแอพอื่น ๆ ด้วยจิตวิญญาณของการเป็นผู้ช่วย AI แบบรวมศูนย์ Copilot จะต้องสามารถรวมเข้ากับแอพของบุคคลที่สามทุกประเภทได้อย่างง่ายดาย เราเห็นสิ่งนี้ในการดำเนินการเมื่อ Microsoft สาธิต Copilot ที่ งานสร้างปีนี้ และใช้เล่นเพลงด้วย Spotify แต่เรายังไม่เห็นว่าจะใช้งานได้จริง และจำเป็นต้องไปไกลกว่าพันธมิตรทั่วไปของ Microsoft

Copilot ควรจะสามารถเปิดแอปและเริ่มงานเฉพาะภายในแอปได้ หรือเล่นรายการใดรายการหนึ่งบน Netflix หรือสิ่งอื่นใดที่อาจมีประโยชน์ในแอปเหล่านี้

3 การรวมเข้ากับ File Explorer

ฉันรู้ว่าผู้คนอาจเบื่อและเบื่อกับบริการที่ไม่ต้องการของ Microsoft ทุกที่ที่ทำได้ แต่ฉันคิดว่าการรวม Copilot ใน File Explorer อาจทำให้ มีประโยชน์มากกว่าผู้ใช้ที่ต้องการพิมพ์คำสั่งใน Copilot โดยเฉพาะอย่างยิ่งเนื่องจากต้องมีหน้าต่าง Copilot ซึ่งกินพื้นที่บนหน้าจอของคุณเกือบ อย่างถาวร

การมีคุณลักษณะใน File Explorer ที่คุณสามารถคลิกขวาที่ไฟล์และเลือกอาจเป็นเรื่องที่น่าสนใจ ตัวเลือกที่เรียกว่า "ส่งไปยัง Copilot" ซึ่งจะแจ้งให้ถามว่าคุณต้องการทำอะไร ไฟล์. ตัวอย่างเช่น คุณสามารถขอให้ Copilot ลบพื้นหลังด้วยรูปภาพ หรือขอให้คัดลอกไฟล์เสียงก็ได้ ความสามารถเหล่านี้เป็นทั้งสองอย่างที่เราเห็น แต่โดยปกติแล้วคุณจะต้องลากและวางไฟล์ลงในแผง Copilot ฉันคิดว่าสามารถเข้าถึงโดยตรงจาก File Explorer ได้ (แต่ตัวเลือกในการปิดก็เป็นสิ่งที่ดีเช่นกัน)

4 การควบคุมด้วยเสียง

ฉันสงสัยว่าฉันอยู่คนเดียวในอันนี้ ซึ่งเป็นเหตุผลที่ฉันผลักอันนี้ลงเล็กน้อย เห็นได้ชัดว่าคำสั่งเสียงเป็นที่นิยมในโทรศัพท์ และตอนนี้ Bing Chat รองรับคุณสมบัตินี้เฉพาะเมื่อคุณใช้โทรศัพท์เท่านั้น แต่ฉันคิดว่ามันคงจะดีถ้ารองรับคำสั่งเสียง แล็ปท็อป และพีซีด้วย ความสามารถในการเปลี่ยนการตั้งค่าเหล่านี้ เริ่มเล่นเพลง หรือเปิดแอปด้วยเสียงของคุณอาจเป็นประโยชน์ และเช่นเดียวกับการถามคำถาม Bing Cortana รองรับเมื่อเปิดตัว Windows 11 และ Microsoft ต้องการให้เรื่องนี้เป็นเรื่องใหญ่ ดังนั้นฉันไม่แน่ใจว่ามันจะได้รับแรงฉุดมากจริง ๆ หรือไม่ แต่ฉันเห็นว่ามันมีประโยชน์อย่างแน่นอน

เมื่อใช้เบราว์เซอร์ คุณต้องพยายามอย่างมากเพื่อเริ่มต้นการโต้ตอบด้วยเสียง แต่ด้วย คุณลักษณะในตัว คุณสามารถมีคีย์เวิร์ดเปิดใช้งานหรือทางลัด เพื่อให้คุณสามารถพูดได้อย่างรวดเร็ว คำสั่ง ฉันคิดว่ามันคงไม่ยากที่จะนำไปใช้เนื่องจากการรู้จำเสียงมีการใช้งานแล้วในหลายส่วนของ Windows

5 การอ่านหน้าจอและ OCR

สิ่งสุดท้ายที่ฉันอยากเห็น Copilot สามารถทำได้คืออ่านข้อมูลบนหน้าจอ และโดยเฉพาะอย่างยิ่ง การรู้จำอักขระด้วยแสง (OCR) ตอนนี้ คุณสามารถขอให้ Copilot สรุปหน้าเว็บได้ แต่ต้องอยู่ในเว็บไซต์ที่เปิดใน Edge ซึ่งจะจำกัดฟังก์ชันการทำงานอย่างมาก แม้ว่าแนวทางที่เหมาะสมที่สุดก็คือให้สิ่งนี้ทำงานร่วมกับเบราว์เซอร์อื่นๆ ได้แบบเนทีฟ แต่ก็น่าสนใจหาก Copilot ทำได้ โดยพื้นฐานแล้วจะทำหน้าที่เป็นโปรแกรมอ่านหน้าจอ (เช่น โปรแกรมผู้บรรยาย) และใช้โปรแกรมนั้นเพื่อดึงข้อมูลจากหน้าใดๆ บนเบราว์เซอร์หรือแอปใดๆ ไปยัง สรุปมัน

ฟีเจอร์เด็ดอีกอย่างคือ OCR หรือความสามารถในการจดจำข้อความในรูปภาพ ดังนั้นคุณสามารถขอให้ Copilot ดึงข้อความจากรูปภาพหรือการสแกน PDF และเพียงแค่คัดลอกหรือสรุป สิ่งนี้ไม่ได้บ้าจริง ๆ เนื่องจากมีรายงานว่ามีการวางแผนความสามารถ OCR บางประเภท วินโดวส์ 12ดังนั้นฉันแน่ใจว่าเราจะได้เห็นอะไรบางอย่างในบรรทัดนี้

มีศักยภาพที่ไม่ได้ใช้มากขึ้น

ฉันได้สำรวจความชอบส่วนตัวและความปรารถนาของฉันที่นี่ แต่ด้วยสิ่งที่มีความสามารถเทียบเท่ากับ Copilot และโมเดลภาษาขนาดใหญ่ที่ขับเคลื่อนมัน ฉันแน่ใจว่ามีแนวคิดอีกมากมายที่ผู้คนอาจพบว่ามีประโยชน์ โดยไม่คำนึงว่าอนาคตของ Copilot และ Windows นั้นค่อนข้างน่าตื่นเต้น โดยสมมติว่า Microsoft สามารถส่งมอบผลิตภัณฑ์นี้ได้ตามคำสัญญา สิ่งนั้นจะเกิดขึ้นจริงหรือไม่นั้นเป็นคำถามอื่นทั้งหมด