- 17:30אוקמוטו היפני משבח את הפוטנציאל של מרוקו בתעשיית משחקי הווידאו
- 16:45מה משמעות השעיית שיתוף הפעולה בין איראן לסוכנות הבינלאומית לאנרגיה אטומית?
- 16:00תחת הדחף של החזון המלכותי, מרוקו מבססת את עצמה כשחקנית אסטרטגית בניהול בינה מלאכותית.
- 15:15טראמפ מארח מנהיגים אפריקאים בבית הלבן לחיזוק השותפות הכלכלית
- 14:58גואטמלה מאשררת מחדש את תמיכתה בתוכנית האוטונומיה של מרוקו לסהרה
- 14:30הרפובליקנים בבית הנבחרים דוחפים את "החוק הגדול והיפה" של טראמפ למרות פילוגים פנימיים
- 13:47נתניהו נשבע לחסל את חמאס, בעוד הארגון בוחן הצעה חדשה להפסקת אש
- 13:15אסון ימי באינדונזיה: 61 נעדרים לאחר טבעה של מעבורת ליד באלי
- 12:30מרוקו מצטרפת למעגל המובילים העולמיים בייצור סוללות ליתיום-יון
עקבו אחרינו בפייסבוק
מיקרוסופט מפתחת בינה מלאכותית המסוגלת לשלוט בתוכניות Windows
מיקרוסופט הכריזה על פיתוח מודל חדש של בינה מלאכותית בשם "Large Action Model, או LAM", הבולט ביכולתו להריץ תוכניות Windows ולבצע משימות באופן עצמאי. מודל זה מהווה קפיצת מדרגה איכותית מבחינת בינה מלאכותית. לבצע פקודות.
בניגוד למודלים של שפה מסורתית, כגון GPT-4o, שתפקידם מוגבל לעיבוד ויצירת טקסט, למודל ה-LAM החדש של מיקרוסופט יש את היכולת להפוך שאילתות משתמש לפעולות אמיתיות, אשר כולל הפעלת תוכניות או שליטה בחומרה.
הרעיון הזה כבר היה קיים, אבל LAM הוא הדגם הראשון שהוכשר במיוחד לעבודה עם מוצרי שולחן העבודה של Microsoft Office ויישומי Windows אחרים.
לדוגמה: בעת קניות מקוונות, דגמים מסורתיים יכולים לספק הוראות טקסט כיצד לרכוש, בעוד שדגם LAM יכול להשלים את תהליך הרכישה בעצמו על ידי ניווט ברשת ממשק האתר.
לפי מיקרוסופט, פיתוח מודל זה דורש ארבעה שלבים עיקריים: הדרכה בתכנון משימות וחלוקת המשימה לשלבים לוגיים, לימוד מודלים מתקדמים (כגון GPT-4o) להפיכת תוכניות לפעולות, וחקירה עצמית המאפשרת למודל לחפש פתרונות חדשים ולהתגבר על מכשולים. מודלים אחרים לא מצליחים להשיג זאת, כמו גם אימון מבוסס תגמול לשיפור דיוק הביצוע.
החוקרים בדקו את מודל ה-LAM בסביבת בדיקה של תוכנית עריכת הטקסט "Word" והשלימו את המשימות בהצלחה בשיעור של 71%, תוך ביצועים טובים יותר מ-GPT-4o, שהשיג שיעור הצלחה של 63% ללא מידע חזותי. מודל ה-LAM היה גם מהיר יותר, ולקח 30 דקות להשלמת המשימות, שנייה אחת בלבד לביצוע המשימה, בהשוואה ל-86 שניות עבור GPT-4o. עם זאת, כאשר הוזנה ל-GPT-4o מידע חזותי, הדיוק שלו השתפר עד ל-75.5%.
צוות מיקרוסופט הסתמך על אלפי נתוני אימון שנכרו ממסמכי מיקרוסופט, מאמרי wikiHow וחיפושי Bing, ואז הצוות השתמש במודל GPT-4o כדי להרחיב את המשימות הללו למשימות מורכבות אחרות.
עם פיתוח זה, מודל LAM מתמודד עם כמה אתגרים, לרבות יישום לא נכון של פעולות, כמה בעיות ארגוניות הדורשות פתרונות ומגבלות טכניות המשפיעות על מדרגיות ויישום בתחומים שונים.
החוקרים מאמינים כי LAM מהווה פריצת דרך גדולה בתחום הבינה המלאכותית, ומציינים כי היא יכולה לסלול את הדרך לפיתוח של בינה כללית מלאכותית (AGI). במקום מערכות שפשוט מבינות ומייצרות טקסט, חברות יוכלו להציע בקרוב עוזרים דיגיטליים שבאמת עוזרים לבצע משימות יומיומיות ביעילות.
תגובות (0)