محققان به تازگی ChatGPT | را باز کرده اند گرایش های دیجیتال

2024-01-04

0 2 دقیقه قبل خوانده شده

محققان کشف کرده‌اند که می‌توان مکانیسمی را که در چت ربات‌های هوش مصنوعی تعبیه شده دور زد تا بتوانند با استفاده از یک چت ربات هوش مصنوعی به عنوان بخشی از فرآیند آموزش، به سؤالات مربوط به موضوعات ممنوعه یا حساس پاسخ دهند.

تیمی از دانشمندان کامپیوتر از دانشگاه فناوری نانیانگ (NTU) در سنگاپور به طور غیررسمی این روش را “جیل بریک” می نامند، اما به طور رسمی تر، این یک فرآیند “Masterkey” است. این سیستم ربات‌های چت شامل ChatGPT، Google Bard و Microsoft Bing Chat را در یک روش آموزشی دو قسمتی در برابر یکدیگر قرار می‌دهد که به دو ربات چت اجازه می‌دهد الگوهای یکدیگر را یاد بگیرند و هر دستوری را در برابر موضوعات ممنوعه منحرف کنند.

ChatGPT در مقابل Google در گوشی‌های هوشمند. — DigitalTrends

این تیم شامل پروفسور لیو یانگ و Ph.D. از NTU دانش‌آموزان آقای دنگ گلی و لیو یی که در این تحقیق مشارکت داشتند و روش‌های حمله اثبات مفهومی را توسعه دادند که اساساً مانند هک بازیگر بد عمل می‌کنند.

به گفته این تیم، آنها ابتدا یک مدل زبان بزرگ (LLM) طراحی کردند تا مکانیسم های دفاعی آن را آشکار کنند. در ابتدا، آن‌ها بلوک‌های مدل بودند و اجازه نمی‌دادند که پاسخ‌ها به برخی اعلان‌ها یا کلمات به‌دلیل نیت خشونت‌آمیز، غیراخلاقی یا بدخواهانه به عنوان پاسخ منتقل شوند.

اما با این اطلاعات مهندسی معکوس، آنها می توانند به یک LLM مختلف نحوه ایجاد یک بای پس را آموزش دهند. با بای پس ایجاد شده، مدل دوم قادر خواهد بود با مهندسی معکوس مدل اول، خود را آزادتر بر اساس LLM بیان کند. تیم این فرآیند را “Masterkey” نامیده است زیرا حتی اگر چت ربات‌های LLM با امنیت بیشتری افزایش یابند یا در آینده وصله شوند، باید کار کند.

مطلب پیشنهادی: من بدون Rambox نمی توانستم زندگی کاری و اجتماعی خود را مدیریت کنم

فرآیند Masterkey ادعا می کند که سه برابر بهتر از دستورات در جیلبریک کردن چت بات ها است.

پروفسور لوئیس یانگ خاطرنشان کرد که ماهیت این فرآیند این است که نشان می دهد چت ربات های هوش مصنوعی LLM چگونه به راحتی می توانند یاد بگیرند و سازگار شوند. این تیم ادعا می کند که فرآیند Masterkey آن سه برابر موفق تر از یک فرآیند سریع سنتی در جیلبریک کردن چت ربات های LLM بوده است. به طور مشابه، برخی از کارشناسان استدلال می کنند که مشکلات اخیر پیشنهاد شده که برخی از LLM ها، مانند GPT-4، با آن مواجه هستند، نشانه هایی از پیشرفته تر شدن آنها است، نه احمقانه و تنبل تر، همانطور که برخی از منتقدان ادعا می کنند.

از آنجایی که چت ربات‌های هوش مصنوعی در اواخر سال 2022 با معرفی ChatGPT OpenAI محبوب شدند، فشار زیادی برای اطمینان از ایمن بودن سرویس‌های مختلف برای استفاده همگان انجام شد. OpenAI در هنگام ثبت نام و به روز رسانی های پراکنده هشدارهای ایمنی را روی محصول ChatGPT خود قرار داده است و در مورد خطاهای زبانی ناخواسته هشدار می دهد. در همین حال، اسپین‌آف‌های مختلف چت بات در اجازه دادن به توهین و زبان توهین‌آمیز تا حدی خوب ثابت شده‌اند.

علاوه بر این، بازیگران بد واقعی به سرعت شروع به استفاده از جستجوی ChatGPT، Google Bard و دیگر چت‌بات‌ها کردند، قبل از اینکه به طور گسترده در دسترس قرار گیرند. بسیاری از کمپین‌ها محصولات را در رسانه‌های اجتماعی با بدافزار متصل به پیوندهای تصویر، در میان حملات دیگر، تبلیغ کردند. به سرعت نشان داد که هوش مصنوعی مرز بعدی در جرایم سایبری است.

مطلب پیشنهادی: پیش رزرو برای سری Samsung Galaxy Book 4 قبل از عرضه در هند آغاز می شود

تیم تحقیقاتی NTU با ارائه دهندگان خدمات چت بات هوش مصنوعی درگیر در این مطالعه در مورد داده های اثبات مفهومی که نشان می دهد فرار از زندان چت بات واقعی است، تماس گرفت. این تیم همچنین یافته های خود را در سمپوزیوم امنیت شبکه و سیستم های توزیع شده در سن دیگو در ماه فوریه ارائه خواهد کرد.

توصیه های سردبیران

2024-01-04

0 2 دقیقه قبل خوانده شده

محققان به تازگی ChatGPT | را باز کرده اند گرایش های دیجیتال

دیدگاهتان را بنویسید لغو پاسخ

لپ‌تاپ Lenovo Yoga 7i 2-in-1 با کلید Copilot ویژه پردازنده‌های Intel Core Ultra 7 در هند ارتقا یافته است.

چگونه یک ویژگی خاص عکاسی گوشی هوشمند من را برای همیشه تغییر داد

استارت‌آپ Synthesia با پشتیبانی انویدیا از آواتارهای هوش مصنوعی رونمایی کرد که می‌توانند احساسات انسانی را منتقل کنند.

نحوه ایجاد Memoji در مک

Oppo A60 با صفحه نمایش LCD 6.67 اینچی، Snapdragon 680 SoC راه اندازی شد: قیمت، مشخصات

با توجه به اینکه Meta، Alphabet، Snap رشد سریع تری را نشان می دهند، بازار تبلیغات دیجیتالی دوباره رشد می کند

قهرمان گمنام پشت نوسازی لپ تاپ ویندوز

Nix Mini 2: بهترین لوازم جانبی هوشمند که از آن خبر نداشتید

متا 200 میلیارد دلار از ارزش خود را از دست داد، زاکربرگ روی هوش مصنوعی و متاورس تمرکز کرد

Snapdragon X Elite در Geekbench قرار گرفت و در تست چند هسته ای تراشه M3 اپل را شکست داد

نوشته های مشابه

فرصت خرید مانیتور 27 اینچی Dell را با قیمت 150 دلار از دست ندهید

توییتر API لینک ها، تصاویر در وب سایت را امروز صبح شکست

تخفیف ها به تازگی بر روی ماوس جادویی و Trackpad اپل آمده است

بررسی‌های اپل ویژن پرو تصویری متفاوت اما هیجان‌انگیز را ارائه می‌کنند

دیدگاهتان را بنویسید لغو پاسخ