تکنولوژی

آیا می دانستید که ChatGPT می تواند (تقریبا) در آزمون مجوز پزشکی ایالات متحده قبول شود؟

بر اساس مطالعه ای که توسط تیفانی کونگ، ویکتور تسنگ و همکارانش انجام شد، ChatGPT می تواند به حدود 60 درصد آستانه قبولی برای آزمون مجوز پزشکی ایالات متحده (USMLE) برسد، با پاسخ هایی که حس درونی منسجم دارند و حاوی بینش های مکرر هستند. AnsibleHealth، که در 9 فوریه 2023 در مجله دسترسی آزاد PLOS Digital Health منتشر شد.

یک مدل زبان بزرگ (LLM) یا سیستم هوش مصنوعی جدید (AI) به نام ChatGPT با پیش‌بینی دنباله‌ای از کلمات در آینده، قصد دارد تایپی شبیه به انسان ایجاد کند. ChatGPT بر خلاف بسیاری از ربات های چت نمی تواند جستجوهای آنلاین را انجام دهد. در عوض، متنی را بر اساس روابط بین کلماتی که توسط فرآیندهای داخلی پیش‌بینی می‌شوند، تولید می‌کند.

کونگ و همکارانش اثربخشی ChatGPT را بر روی USMLE آزمایش کردند، مجموعه ای بسیار استاندارد و تنظیم شده از سه امتحان (مرحله 1، 2CK، و 3) که برای صدور مجوز پزشکی در ایالات متحده لازم است. USMLE که توسط دانشجویان پزشکی و پزشکان در حال آموزش انجام می‌شود، دانشی را که بیشتر رشته‌های پزشکی را شامل می‌شود، از بیوشیمی گرفته تا استدلال تشخیصی و اخلاق زیستی ارزیابی می‌کند.

پس از بررسی حذف سوالات مبتنی بر تصویر، نویسندگان نرم افزار را روی 350 سوال از 376 سوال عمومی موجود در نسخه ژوئن 2022 USMLE آزمایش کردند.

پس از حذف پاسخ های نامشخص، ChatGPT در سه آزمون USMLE بین 52.4% و 75.0% امتیاز کسب کرد. آستانه قبولی در هر سال تقریباً 60 درصد است. ChatGPT همچنین 94.6 درصد تطابق را در تمام پاسخ‌های خود نشان داد و حداقل یک بینش مهم (چیزی که بدیع، غیر آشکار و از نظر بالینی معتبر بود) برای 88.9 درصد از پاسخ‌های خود ایجاد کرد. شایان ذکر است، ChatGPT بهتر از PubMedGPT، یک مدل آنالوگ که منحصراً بر روی ادبیات زیست پزشکی آموزش داده شده بود، عملکرد بهتری داشت و در مجموعه سوالات قدیمی‌تر به سبک USMLE، 50.8٪ امتیاز کسب کرد.

مطلب پیشنهادی:  مدیر عامل مرسدس بنز به اپل «نه» و به گوگل «بله» گفت در حالی که اولا کلنیوس در CarPlay اظهاراتی جسورانه می کند.

اگرچه اندازه ورودی نسبتاً کوچک، عمق و دامنه تحلیل‌ها را محدود می‌کرد، نویسندگان خاطرنشان می‌کنند که یافته‌های آنها نگاهی اجمالی به پتانسیل ChatGPT برای بهبود آموزش پزشکی و در نهایت عملکرد بالینی ارائه می‌دهد. به عنوان مثال، آنها اضافه می‌کنند که پزشکان در AnsibleHealth در حال حاضر از ChatGPT برای بازنویسی گزارش‌های سنگین برای درک آسان‌تر توسط بیماران استفاده می‌کنند.

نویسندگان می‌گویند: «دستیابی به یک نمره مثبت در این آزمون تخصصی دشوار و انجام آن بدون هیچ گونه تقویت انسانی، نقطه عطف قابل توجهی در بلوغ بالینی هوش مصنوعی است».

نویسنده دکتر تیفانی کونگ افزود که نقش ChatGPT در این تحقیق فراتر از موضوع مطالعه است: “ChatGPT کمک قابل توجهی به نوشتن [our] دست‌نوشته… ما به‌عنوان یک همکار با ChatGPT بسیار تعامل داشتیم و از او می‌خواستیم که پیش‌نویس‌های در دست اجرا را ترکیب، ساده‌سازی و ارائه کند… همه نویسندگان از نظرات ChatGPT قدردانی کردند.”


نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا