- 16:16ירידה דרמטית באמון העסקים העולמי לאחר העלאת התעריפים של ארה"ב-סין
- 10:00השווקים העולמיים בלחץ לאחר המכסים החדשים של טראמפ
- 10:42השווקים העולמיים מתערערים לאחר המכסים של טראמפ
- 14:15מיקרוסופט משיקה סוכני בינה מלאכותית לחיזוק האבטחה.
- 13:30ענקיות הטכנולוגיה מתחייבות לשלש את השימוש בכוח גרעיני עד 2050
- 12:45הביקוש העולמי לאנרגיה יגדל מהר מהממוצע בשנת 2024
- 11:20ועידת פריז מגייסת 28 מיליארד דולר כדי להילחם בתת תזונה עולמית.
- 20:00YouTube מקדימה את הערוצים המסורתיים ומושכת אנשים מעל גיל 50.
- 17:57מחירי הנפט יורדים על רקע החשש ממכסים בארה"ב.
עקבו אחרינו בפייסבוק
מיקרוסופט מפתחת בינה מלאכותית המסוגלת לשלוט בתוכניות Windows
מיקרוסופט הכריזה על פיתוח מודל חדש של בינה מלאכותית בשם "Large Action Model, או LAM", הבולט ביכולתו להריץ תוכניות Windows ולבצע משימות באופן עצמאי. מודל זה מהווה קפיצת מדרגה איכותית מבחינת בינה מלאכותית. לבצע פקודות.
בניגוד למודלים של שפה מסורתית, כגון GPT-4o, שתפקידם מוגבל לעיבוד ויצירת טקסט, למודל ה-LAM החדש של מיקרוסופט יש את היכולת להפוך שאילתות משתמש לפעולות אמיתיות, אשר כולל הפעלת תוכניות או שליטה בחומרה.
הרעיון הזה כבר היה קיים, אבל LAM הוא הדגם הראשון שהוכשר במיוחד לעבודה עם מוצרי שולחן העבודה של Microsoft Office ויישומי Windows אחרים.
לדוגמה: בעת קניות מקוונות, דגמים מסורתיים יכולים לספק הוראות טקסט כיצד לרכוש, בעוד שדגם LAM יכול להשלים את תהליך הרכישה בעצמו על ידי ניווט ברשת ממשק האתר.
לפי מיקרוסופט, פיתוח מודל זה דורש ארבעה שלבים עיקריים: הדרכה בתכנון משימות וחלוקת המשימה לשלבים לוגיים, לימוד מודלים מתקדמים (כגון GPT-4o) להפיכת תוכניות לפעולות, וחקירה עצמית המאפשרת למודל לחפש פתרונות חדשים ולהתגבר על מכשולים. מודלים אחרים לא מצליחים להשיג זאת, כמו גם אימון מבוסס תגמול לשיפור דיוק הביצוע.
החוקרים בדקו את מודל ה-LAM בסביבת בדיקה של תוכנית עריכת הטקסט "Word" והשלימו את המשימות בהצלחה בשיעור של 71%, תוך ביצועים טובים יותר מ-GPT-4o, שהשיג שיעור הצלחה של 63% ללא מידע חזותי. מודל ה-LAM היה גם מהיר יותר, ולקח 30 דקות להשלמת המשימות, שנייה אחת בלבד לביצוע המשימה, בהשוואה ל-86 שניות עבור GPT-4o. עם זאת, כאשר הוזנה ל-GPT-4o מידע חזותי, הדיוק שלו השתפר עד ל-75.5%.
צוות מיקרוסופט הסתמך על אלפי נתוני אימון שנכרו ממסמכי מיקרוסופט, מאמרי wikiHow וחיפושי Bing, ואז הצוות השתמש במודל GPT-4o כדי להרחיב את המשימות הללו למשימות מורכבות אחרות.
עם פיתוח זה, מודל LAM מתמודד עם כמה אתגרים, לרבות יישום לא נכון של פעולות, כמה בעיות ארגוניות הדורשות פתרונות ומגבלות טכניות המשפיעות על מדרגיות ויישום בתחומים שונים.
החוקרים מאמינים כי LAM מהווה פריצת דרך גדולה בתחום הבינה המלאכותית, ומציינים כי היא יכולה לסלול את הדרך לפיתוח של בינה כללית מלאכותית (AGI). במקום מערכות שפשוט מבינות ומייצרות טקסט, חברות יוכלו להציע בקרוב עוזרים דיגיטליים שבאמת עוזרים לבצע משימות יומיומיות ביעילות.
תגובות (0)