- 13:13בריטניה וגרמניה מתקדמות משמעותית במעבר האנרגיה ב-2024
- 11:57מומחים מזהירים מפני הסיכונים של מדיניות פרוטקציוניסטית לכלכלה העולמית
- 10:002024: שנת ההמצאה מחדש של אורח החיים העולמי
- 08:30מדד מחירי המזון העולמי ירד בדצמבר, עם ירידה במחירי הסוכר והחלב
- 15:00מחירי המזון בעולם ירדו ב-2% בשנת 2024: ארגון המזון והחקלאות
- 13:25מל"טים של העתיד: כיצד ביומימיקה יכולה לחולל מהפכה בטכנולוגיה האווירונאוטית
- 11:11מחירי הנפט התייצבו, בתמיכת ירידה במלאים בארה"ב ואופטימיות בשוק
- 09:16מצב החירום האקלימי והמתח הגיאופוליטי: שנת 2024 על פרשת דרכים
- 08:38האם המרוקאים משלמים מיסי מכירה גבוהים? השוואה ערבית ובינלאומית
עקבו אחרינו בפייסבוק
מיקרוסופט מפתחת בינה מלאכותית המסוגלת לשלוט בתוכניות Windows
מיקרוסופט הכריזה על פיתוח מודל חדש של בינה מלאכותית בשם "Large Action Model, או LAM", הבולט ביכולתו להריץ תוכניות Windows ולבצע משימות באופן עצמאי. מודל זה מהווה קפיצת מדרגה איכותית מבחינת בינה מלאכותית. לבצע פקודות.
בניגוד למודלים של שפה מסורתית, כגון GPT-4o, שתפקידם מוגבל לעיבוד ויצירת טקסט, למודל ה-LAM החדש של מיקרוסופט יש את היכולת להפוך שאילתות משתמש לפעולות אמיתיות, אשר כולל הפעלת תוכניות או שליטה בחומרה.
הרעיון הזה כבר היה קיים, אבל LAM הוא הדגם הראשון שהוכשר במיוחד לעבודה עם מוצרי שולחן העבודה של Microsoft Office ויישומי Windows אחרים.
לדוגמה: בעת קניות מקוונות, דגמים מסורתיים יכולים לספק הוראות טקסט כיצד לרכוש, בעוד שדגם LAM יכול להשלים את תהליך הרכישה בעצמו על ידי ניווט ברשת ממשק האתר.
לפי מיקרוסופט, פיתוח מודל זה דורש ארבעה שלבים עיקריים: הדרכה בתכנון משימות וחלוקת המשימה לשלבים לוגיים, לימוד מודלים מתקדמים (כגון GPT-4o) להפיכת תוכניות לפעולות, וחקירה עצמית המאפשרת למודל לחפש פתרונות חדשים ולהתגבר על מכשולים. מודלים אחרים לא מצליחים להשיג זאת, כמו גם אימון מבוסס תגמול לשיפור דיוק הביצוע.
החוקרים בדקו את מודל ה-LAM בסביבת בדיקה של תוכנית עריכת הטקסט "Word" והשלימו את המשימות בהצלחה בשיעור של 71%, תוך ביצועים טובים יותר מ-GPT-4o, שהשיג שיעור הצלחה של 63% ללא מידע חזותי. מודל ה-LAM היה גם מהיר יותר, ולקח 30 דקות להשלמת המשימות, שנייה אחת בלבד לביצוע המשימה, בהשוואה ל-86 שניות עבור GPT-4o. עם זאת, כאשר הוזנה ל-GPT-4o מידע חזותי, הדיוק שלו השתפר עד ל-75.5%.
צוות מיקרוסופט הסתמך על אלפי נתוני אימון שנכרו ממסמכי מיקרוסופט, מאמרי wikiHow וחיפושי Bing, ואז הצוות השתמש במודל GPT-4o כדי להרחיב את המשימות הללו למשימות מורכבות אחרות.
עם פיתוח זה, מודל LAM מתמודד עם כמה אתגרים, לרבות יישום לא נכון של פעולות, כמה בעיות ארגוניות הדורשות פתרונות ומגבלות טכניות המשפיעות על מדרגיות ויישום בתחומים שונים.
החוקרים מאמינים כי LAM מהווה פריצת דרך גדולה בתחום הבינה המלאכותית, ומציינים כי היא יכולה לסלול את הדרך לפיתוח של בינה כללית מלאכותית (AGI). במקום מערכות שפשוט מבינות ומייצרות טקסט, חברות יוכלו להציע בקרוב עוזרים דיגיטליים שבאמת עוזרים לבצע משימות יומיומיות ביעילות.
תגובות (0)