نجح روبوت الدردشة الطبي من "غوغل" في تحقيق درجة النجاح في اختبار ترخيص طبي أميركي صعب، لكن إجاباته لا تزال أقل من إجابات الأطباء البشريين، بحسب ما بينت دراسة أمس الأربعاء.
وكشفت "غوغل" عن أداة الذكاء الاصطناعي الخاصة بها للإجابة عن الأسئلة الطبية، التي تسمى Med-PaLM (ميد بالم)، في دراسة غير مطبوعة في ديسمبر/كانون الأول.
وعلى عكس ChatGPT، لم تطرح "غوغل" روبوت الدردشة الطبي للجمهور.
وتقول "غوغل" إن "ميد بالم" أول نموذج لغوي توليدي يجتاز امتحان الترخيص الطبي الأميركي USMLE.
وتبلغ درجة النجاح في الامتحان، الذي يجتازه طلاب الطب والأطباء المتدربون في الولايات المتحدة، حوالى 60 بالمائة.
وفي دراسة مراجَعة نُشرت أمس الأربعاء في مجلة نيتشر، قال باحثو "غوغل" إن "ميد بالم" حقق 67.6 بالمائة في أسئلة الاختيارات المتعدد على غرار USMLE.
وقالت الدراسة إن "ميد بالم يعمل بشكل مشجع، لكنه لا يزال أدنى من الأطباء".
ولرصد وتقليل "الهلوسة" غيّرت "غوغل" مقاييس التقييم.
وقال الباحث في "غوغل" والمعد الرئيسي للدراسة الجديدة، كاران سينغال، لوكالة فرانس برس إن الفريق استخدم مقاييس جديدة، فحقّق نتائج "مثيرة للغاية".
وحقق "ميد بالم 2" علامة 86.5 بالمائة في الامتحان الطبي USMLE، متفوقاً على الإصدار السابق بحوالى 20 بالمائة، وفقاً لدراسة غير مراجعة في مايو/أيار.
لكن عالِم الكمبيوتر، جيمس دافنبورت، قال إن هناك فرقاً كبيراً بين "الإجابة عن الأسئلة الطبية" و"الطب الفعلي" الذي يشمل "تشخيص وعلاج مشاكل صحية حقيقية".
وقال خبير الذكاء الاصطناعي، أنتوني كوهن، إن الهلوسة من المحتمل أن تكون دائماً مشكلة لمثل هذه النماذج اللغوية، بسبب طبيعتها الإحصائية.
وقال كوهن إنه لذلك "ينبغي دائماً اعتبار هذه النماذج مساعدة وليست صانعة القرار النهائية".
وأيّده سينغال الذي قال إنه في المستقبل يمكن استخدام "ميد بالم" لدعم الأطباء وتقديم بدائل لم يُعثر عليها بطريقة أخرى.