OPPO הדגימה לאחרונה חלק מטכנולוגיות המצלמות הפוטנציאליות שלה בכנס הווירטואלי של Computer Vision and Patter Recognition (CVPR) 2020.
יצרנית הסמארטפונים הסינית OPPO הדגימה כמה מטכנולוגיות המצלמה החדשות הפוטנציאליות שלה ב-Computer Vision ו ועידת זיהוי דפוסים (CVPR) 2020, אשר זיכתה את החברה בשני פרסי מקום ראשון ושני שלישי ב- מִקרֶה. הטכנולוגיות שזכו בפרסים כוללות טכנולוגיית רזולוציית-על קיצונית תפיסתית, לוקליזציה חזותית וזיהוי פעילות אנושית בסרטונים.
רזולוציית סופר קיצונית תפיסתית
במהלך האירוע, צוות המחקר של OPPO האתגר לפתור את הבעיה של רזולוציית-על קיצונית תפיסתית עבור תמונה בודדת עם מקדם הגדלה של פי 16. מטרת האתגר הייתה לפתח מודל AI המסוגל לייצר תוצאות ברזולוציה גבוהה עם האיכות התפיסתית והדמיון הטובה ביותר לאמת הקרקע. לצורך האתגר, הצוות של OPPO הוכיח את היעילות של הרשת העצבית RFB-ERSGAN שלה שהביאה את התוצאות הבאות:
הרשת העצבית של OPPO עזרה לחברה לנצח 280 משתתפים אחרים ולהבטיח את המקום הראשון באתגר. על פי הודעה לעיתונות בנושא, הרשת העצבית תיושם במספר תרחישים, כולל סמארטפונים, שבו הוא יוכל לעזור לשנות תמונות ברזולוציה נמוכה שצולמו על ידי הטלפון החכם לתמונות ברזולוציה גבוהה יותר פרטים. יישומים פוטנציאליים אחרים כוללים שחזור תמונות ישנות או פגומות, חידוד תמונות רפואיות חשובות או ביצוע ניתוח מפורט של תמונות לוויין.
לוקליזציה חזותית עבור מכשירי כף יד
באתגר לוקליזציה חזותית למכשירי כף יד, OPPO יצרה צינור לוקליזציה חזותית חד-קולרית הממנפת רמזים סמנטיים ועומקים כדי למצוא את המיקום המדויק של כל תמונה נתונה. הפתרון של OPPO עזר לחברה להשיג את המקום הראשון עבור לוקליזציה חזותית חיצונית ואת המקום השלישי עבור לוקליזציה ויזואלית פנימית.
מקרי שימוש פוטנציאליים לטכנולוגיה זו כוללים מציאות רבודה יישומים, רובוטיקה חכמה או ניווטים מדויקים. החברה טוענת כי א עוזר בינה מלאכותית מצויד במצלמה יוכל לנצל את הטכנולוגיה כדי לנתח תמונות ולהשיג מיקום מדויק, מה שיאפשר לה להדריך את המשתמשים בכיוון הנכון.
זיהוי פעילות בסרטונים מורחבים
OPPO גם השיגה את המקום השלישי באתגר זיהוי פעילות בסרטונים מורחבים, שחייב חברות לעצב אלגוריתמים אוטומטיים לזיהוי פעילות. הפתרון של OPPO נועד לזהות ולארגן מחדש את הדמויות בכל פריים ולזהות עשרות פעילויות אנושיות בסרטונים דינמיים מורכבים.
הטכנולוגיה צפויה למלא תפקיד חשוב בתחום האינטראקציה בין אדם למחשב וניתוח וידאו ספורט בעתיד. בנוסף, הטכנולוגיה עשויה להימצא גם בסמארטפונים עתידיים שתאפשר להם לזהות אוטומטית נושאים נעים ולהתאים את מיקוד המצלמה בהתאם.