- 18:15השקת פרויקט תעשייתי משותף בין קבוצת OCP ופורטסקיו לייצור דשנים פוספטים ירוקים
- 17:30אפל משיקה את העדכון הראשון שלה לשנת 2025 עם iOS 18.2.1: תיקון שגיאות
- 16:45מיקרוסופט מסתמכת על פלטפורמת קוואלקום כדי להפעיל את רובוט הבינה המלאכותית "Copilot" שלה
- 16:05עבד אל סלאם חמאדה בולט בין החוקרים המשפיעים ביותר בדירוג "אינדקס 2025"
- 15:26ספורט ושינויי אקלים: אתגרים חדשים המאיימים על עולם האלופים
- 14:40מחירי הנפט יציבים למרות חששות הביקוש
- 14:00UBS צופה המשך צמיחת מניות בשנת 2025 למרות אתגרים כלכליים
- 13:00דונלד טראמפ מחייה את הצעת הסיפוח הקנדית שלו לאחר התפטרותו של ג'סטין טרודו
- 12:15השלגים של אוקאימדן: תחיית תיירות לאזור אל חאוז
עקבו אחרינו בפייסבוק
מיקרוסופט מפתחת בינה מלאכותית המסוגלת לשלוט בתוכניות Windows
מיקרוסופט הכריזה על פיתוח מודל חדש של בינה מלאכותית בשם "Large Action Model, או LAM", הבולט ביכולתו להריץ תוכניות Windows ולבצע משימות באופן עצמאי. מודל זה מהווה קפיצת מדרגה איכותית מבחינת בינה מלאכותית. לבצע פקודות.
בניגוד למודלים של שפה מסורתית, כגון GPT-4o, שתפקידם מוגבל לעיבוד ויצירת טקסט, למודל ה-LAM החדש של מיקרוסופט יש את היכולת להפוך שאילתות משתמש לפעולות אמיתיות, אשר כולל הפעלת תוכניות או שליטה בחומרה.
הרעיון הזה כבר היה קיים, אבל LAM הוא הדגם הראשון שהוכשר במיוחד לעבודה עם מוצרי שולחן העבודה של Microsoft Office ויישומי Windows אחרים.
לדוגמה: בעת קניות מקוונות, דגמים מסורתיים יכולים לספק הוראות טקסט כיצד לרכוש, בעוד שדגם LAM יכול להשלים את תהליך הרכישה בעצמו על ידי ניווט ברשת ממשק האתר.
לפי מיקרוסופט, פיתוח מודל זה דורש ארבעה שלבים עיקריים: הדרכה בתכנון משימות וחלוקת המשימה לשלבים לוגיים, לימוד מודלים מתקדמים (כגון GPT-4o) להפיכת תוכניות לפעולות, וחקירה עצמית המאפשרת למודל לחפש פתרונות חדשים ולהתגבר על מכשולים. מודלים אחרים לא מצליחים להשיג זאת, כמו גם אימון מבוסס תגמול לשיפור דיוק הביצוע.
החוקרים בדקו את מודל ה-LAM בסביבת בדיקה של תוכנית עריכת הטקסט "Word" והשלימו את המשימות בהצלחה בשיעור של 71%, תוך ביצועים טובים יותר מ-GPT-4o, שהשיג שיעור הצלחה של 63% ללא מידע חזותי. מודל ה-LAM היה גם מהיר יותר, ולקח 30 דקות להשלמת המשימות, שנייה אחת בלבד לביצוע המשימה, בהשוואה ל-86 שניות עבור GPT-4o. עם זאת, כאשר הוזנה ל-GPT-4o מידע חזותי, הדיוק שלו השתפר עד ל-75.5%.
צוות מיקרוסופט הסתמך על אלפי נתוני אימון שנכרו ממסמכי מיקרוסופט, מאמרי wikiHow וחיפושי Bing, ואז הצוות השתמש במודל GPT-4o כדי להרחיב את המשימות הללו למשימות מורכבות אחרות.
עם פיתוח זה, מודל LAM מתמודד עם כמה אתגרים, לרבות יישום לא נכון של פעולות, כמה בעיות ארגוניות הדורשות פתרונות ומגבלות טכניות המשפיעות על מדרגיות ויישום בתחומים שונים.
החוקרים מאמינים כי LAM מהווה פריצת דרך גדולה בתחום הבינה המלאכותית, ומציינים כי היא יכולה לסלול את הדרך לפיתוח של בינה כללית מלאכותית (AGI). במקום מערכות שפשוט מבינות ומייצרות טקסט, חברות יוכלו להציע בקרוב עוזרים דיגיטליים שבאמת עוזרים לבצע משימות יומיומיות ביעילות.
תגובות (0)