בינה מלאכותית בתחום הבריאות סופגת ביקורת על חוסר אמינותה
לדברי חוקרים, בינה מלאכותית לוקה בחסר דיוק בכל הנוגע לרפואה. מחקר שנערך לאחרונה גילה שכמעט 50% מהתשובות שגויות, למרות שהן עשויות להיראות אמינות. תופעה זו מדאיגה יותר ויותר אנשי מקצוע בתחום הבריאות.
מה אם לבינה מלאכותית אין את כל התשובות? זה מה שתהו חוקרים דוברי אנגלית אלה במחקר על השימוש בצ'אטבוטים. או במילים אחרות: סוכני שיחה המופעלים על ידי בינה מלאכותית. מומחים אמריקאים, קנדים ובריטים ניסו לקבוע האם צ'אטבוטים אלה אמינים כשנשאלו שאלות הקשורות לבריאות. ולהפתעת כולם, רוב התשובות שניתנו היו שקריות באופן פוטנציאלי, או אפילו לחלוטין.
כדי לבצע ניסוי זה, המדענים בדקו את פלטפורמות ChatGPT, Gemini, Meta AI, Grok ו-DeepSeek. הם שאלו את הצ'אטבוטים עשר שאלות בחמש קטגוריות בריאות כדי להעריך את דיוקם ואמינותם, הסבירו במחקר שפורסם ב-BMJ Open.
במהלך מחקרם, המומחים מצאו כי יותר ממחצית העצות הרפואיות שניתנו על ידי צ'אטבוט נחשבו "בעייתיות". מתוך 50% מהתשובות השגויות הללו, 20% אף נחשבו "בעייתיות ביותר". "מערכות אלו יכולות לייצר תשובות שנראות אמינות אך עלולות להיות שגויות", קבעו במחקרם.
עם זאת, החוקרים ציינו כי שאלות סגורות טופלו טוב יותר על ידי הצ'אטבוטים וכי תשובותיהם היו "פחות בעייתיות". שאלות על סרטן וחיסונים, בפרט, הן התחומים שבהם בינה מלאכותית נראית אמינה יותר מהרגיל. בנוגע לתזונה ותאי גזע, הפלטפורמות הראו תוצאות פחות מעודדות באופן משמעותי.
לנוכח תוצאות מדאיגות אלו, החוקרים קוראים למשתמשים לנקוט משנה זהירות. הם גם מצביעים על חוסר האמיתות של כלים אלו, שיכול "להגביר מידע שגוי" אם לא יבואו תחת שליטה במהירות.
כתזכורת, יותר מ-200 מיליון איש שואלים שאלות בריאותיות בנושא בינה מלאכותית מדי שבוע. מספר זה ממשיך לגדול ומדאיג יותר ויותר אנשי מקצוע בתחום הבריאות, במיוחד כאשר משתמשים אומרים שהם סומכים על אחת הפלטפורמות הללו יותר מאשר על רופא אמיתי.
-
11:25
-
10:17
-
09:15
-
08:01
-
18:06
-
16:30
-
16:00
-
15:15
-
14:30
-
13:45
-
13:00
-
12:29