מבזק 21:15 פוזי לקג'ה משבח "מהפכה שקטה" בכדורגל העולמי תחת נשיאותו של אינפנטינו 20:26 מרוקו מבססת את עצמה כספקית המובילה של דשני פוספט לאיחוד האירופי 18:39 שיחות תלת-צדדיות עם אוקראינה נמשכות בז'נבה על רקע סכסוכים טריטוריאליים וחששות ביטחוניים 17:45 טראמפ מחזק את תמיכתו במרוקו ומשנה את האיזון האסטרטגי במערב הים התיכון 17:03 צרפת מבקשת לחזק את מעמדה בתעשיות הביטחון המרוקאיות 16:19 טראמפ מנסה לצייר תמונה ורודה בנאום מצב האומה המסורבל 15:21 תקיפות אוויריות של חונטה במיאנמר הרגו 26 אזרחים בעוד הסכסוך מתעצם 14:28 רבאט תארח כנס של קרן המטבע הבינלאומית לחיזוק שיתוף הפעולה הכלכלי במזרח התיכון ובצפון אפריקה 14:08 טראמפ אומר ש"העדפתו" היא לפתור את בעיית הגרעין של איראן באמצעות דיפלומטיה 13:44 נשיא ישראל מתחיל ביקור רשמי באתיופיה 13:00 אוקראינה: האו"ם מראה תמיכה, וושינגטון מתרחקת 12:15 דוח סיכונים עולמי 2026: מרוקו מתמודדת עם סיכונים חברתיים, כלכליים וסביבתיים שלובים זה בזה 11:29 מרוקו, היעד הערבי השני היפה ביותר וה-30 בעולם בשנת 2026 10:45 מרוקו בין מקבלות השקעות הבנק האירופי להשקעות (EIB) המובילות באפריקה בשנת 2025 10:00 האו"ם חושף אלמנטים מדיוני וושינגטון על סהרה מרוקו 09:15 טראמפ שומר על מכסים למרות החלטת בית המשפט העליון 08:30 דארפור: 67 הרוגים ופצועים בהתקפה של כוחות הסיוע המהיר על כפר בצפון סודן

Meta משיקה מודל בינה מלאכותית של Spirit LM לחיקוי קולות אנושיים

Tuesday 22 October 2024 - 08:45
Meta משיקה מודל בינה מלאכותית של Spirit LM לחיקוי קולות אנושיים

Meta השיקה את מודל הקוד הפתוח החדש שלה, "Spirit LM", אשר נותן מענה לאתגרים הקשורים למודלים מולטי-מודאליים בבינה מלאכותית בהפקת קול.

הדגם החדש שואף לספק חווית אודיו טבעית ואקספרסיבית יותר, המהווה שלב מתקדם בפיתוח רובוטים חכמים המסוגלים לתקשר קולית בדרכים מורכבות ומציאותיות יותר.

מודל "Spirit LM" מבוסס על מודל שפה מיומן מראש המכיל 7 מיליארד פרמטרים, והוא נבדל ביכולתו לעבד סאונד בצורה שונה ממודלים מסורתיים המסתמכים על טכנולוגיות זיהוי דיבור אוטומטי (ASR).

Meta מציין שהגישה המסורתית גורמת לאובדן של ביטויים טבעיים רבים של הקול. לכן, Spirit LM מסתמך על שימוש בפונמות, צלילים וצלילים כדי להתגבר על מגבלות אלו, מה שמאפשר לה להפיק צלילים טבעיים וללמוד משימות חדשות, כולל זיהוי דיבור, המרת טקסט לטקסט וסיווג קול.

Meta חשפה את הדגם הזה במאמר מחקר והזכירה גם את פרטי המחקר שהוביל לפיתוח "Spirit LM", בנוסף לדגימות של ביצועי האודיו של הדגם, מה שנותן מושג ברור לגבי יכולותיו העתידיות.

המודל זמין כעת כפרויקט קוד פתוח למפתחים וחוקרים לשימוש ולהרחיב, וצפוי לשמש בעתיד ביישומי מטה כמו WhatsApp, Instagram ופייסבוק, המאפשרים למשתמשים לקיים אינטראקציה עם בינה מלאכותית באמצעות קול טבעי . שיחות מלאות בביטויים הדומים למצב הקול המתקדם שהציגה לאחרונה OpenAI.


  • פajr
  • זריחת השמש
  • דוהר
  • אסר
  • מגרב
  • עشاء

קרא עוד

האתר הזה, walaw.press, משתמש בעוגיות כדי לספק לך חוויית גלישה טובה ולשפר את השירותים שלנו באופן מתמיד. על ידי המשך הגלישה באתר זה, אתה מסכים לשימוש בעוגיות אלו.