مطالعه هوش مصنوعی توسط محققان گوگل افزایش باورنکردنی در دقت پاسخ Med-PaLM 2 را نشان می دهد
امروزه هوش مصنوعی در تمامی زمینه های تکنولوژیک نفوذ کرده است. در این میان، یکی از رشتههایی که بهویژه در برابر فناوریهای نوظهور مقاوم است، رشته پزشکی است. با توجه به کار در مناطق بسیار حساس که می تواند به سناریوهای مرگ و زندگی منجر شود، رشته پزشکی در مورد پیاده سازی ابزارهای جدید پزشکی در عمل عمومی نگران بوده است. با این حال، هوش مصنوعی مدتی است که در را می زند، و اگر مطالعه جدیدی انجام شده توسط محققان گوگل را باور کنیم، Med-PaLM 2 داخلی گوگل از نظر دقت پاسخگویی به سوالات پزشکی (MedQA) امتیاز بسیار بالایی کسب کرده است و در موقعیتی برتر برای توانمندسازی متخصصان پزشکی برای ارائه مراقبت های پزشکی سریعتر به بیماران.
در عمل، Med-PaLM 2 یک مدل زبان بزرگ پزشکی (LLM) است که برای ترکیب اطلاعات از تصاویر پزشکی آموزش دیده است. در واقع، نه تنها گوگل، بلکه سایر بازیکنان نیز در حال کار بر روی هوش مصنوعی مولد در صنعت مراقبت های بهداشتی هستند و از جمله آنها ChatGPT OpenAI به رهبری سم آلتمن است. و رقابت قوی است. مطالعهای که در JAMA Internal Medicine منتشر شده است، میگوید ChatGPT پاسخهای با کیفیتتری به سؤالات نسبت به پاسخهای نوشتاری پزشکان واقعی ارائه میدهد.
اکنون، روز چهارشنبه، آلن کارتیکسالینگام، رئیس تحقیقات Google Health انگلستان، در توییتر این دستاورد را برجسته کرد. او گفت: «بسیار خوشحالم که #MedPaLM2 – تکامل Med-PaLM توسط تیم ما را به اشتراک میگذارم. سطح جدیدی از تکنیک پاسخگویی به سوالات پزشکی! Med-PaLM 2 در MedQA-USMLE امتیاز 86.5٪ را به دست آورد که بیش از 19٪ از امتیاز Med-PaLM و در PubMedQA 81.8٪ بیشتر بود.
لازم به ذکر است که مجموعه داده MedQA-USMLE یک پرسشنامه چند گزینه ای بر اساس آزمون های مجوز پزشکی ایالات متحده است. بنابراین، کسب نمره بالا اساساً به این معنی است که هوش مصنوعی میتواند از نظر تئوری گواهینامه پزشکی در ایالات متحده را دریافت کند. PubMedQA نیز یک مجموعه داده مشابه است. طبق مطالعه انجام شده توسط این گروه، در مجموعه داده آزمایشی، Med-PaLM 2 امتیاز بالای 86.5٪ را کسب کرد. این مطالعه در حال حاضر در مرحله پیش چاپ در arXiv موجود است. همچنین لازم به ذکر است که این مطالعه هنوز مورد بررسی قرار نگرفته یا در مجله ای منتشر نشده است.
هوش مصنوعی گوگل در آزمون مجوز پزشکی امتیاز بالایی کسب می کند
Karthikesalingam در یک سری توییت گفت که سطح بالایی از بررسی انجام شده تا اطمینان حاصل شود که نتایج آزمایش تصادفی یا ارائه نادرست از قابلیتهای پلتفرم هوش مصنوعی نبوده است. او گفت: «ما به ارزیابی دقیق و دقیق اعتقاد داریم. پزشکان حتی پاسخ های طولانی #MedPaLM2 را به پاسخ های سایر پزشکان واقعی در 9/8 محور کیفیت، از جمله دقت پزشکی (اجماع نظر پزشکی) و استدلال، با احتمال آسیب کمتر ترجیح دادند.
او افزود: “برای تاکید بر اهمیت ارزیابی دقیق دنیای واقعی، ما مجموعه جدیدی از سوالات “رقیب” را معرفی می کنیم که به طور خاص برای بررسی نقاط ضعف LLM از جمله #HealthEquity طراحی شده است.
در حال حاضر مشخص نیست که این فناوری جدید هوش مصنوعی چقدر می تواند در زمینه پزشکی تأثیر بگذارد، اما به نظر می رسد گوگل در مورد نتایج خوشبین است. با این حال، مطالعه فقط شروع است. برای اینکه این فناوری بکار گرفته شود و در موقعیتهای واقعی مورد استفاده قرار گیرد، باید تحت بررسیهای دقیقتری قرار گیرد تا بفهمیم آیا هوش مصنوعی میتواند به طور مداوم و قابل اعتماد به بیماران در مراقبتهای بهداشتی کمک کند.
با این حال، حتی ساندار پیچای، رئیس گوگل، در حین سخنرانی در نمایشگاه Google I/O که اخیرا برگزار شد، نحوه کار این شرکت بر روی این فناوری را به شیوه ای دقیق و مسئولانه برای اطمینان از اینکه اشتباه نمی کند، برجسته کرد.