محققان به تازگی ChatGPT | را باز کرده اند گرایش های دیجیتال

2024-01-04

0 2 دقیقه قبل خوانده شده

محققان کشف کرده‌اند که می‌توان مکانیسمی را که در چت ربات‌های هوش مصنوعی تعبیه شده دور زد تا بتوانند با استفاده از یک چت ربات هوش مصنوعی به عنوان بخشی از فرآیند آموزش، به سؤالات مربوط به موضوعات ممنوعه یا حساس پاسخ دهند.

تیمی از دانشمندان کامپیوتر از دانشگاه فناوری نانیانگ (NTU) در سنگاپور به طور غیررسمی این روش را “جیل بریک” می نامند، اما به طور رسمی تر، این یک فرآیند “Masterkey” است. این سیستم ربات‌های چت شامل ChatGPT، Google Bard و Microsoft Bing Chat را در یک روش آموزشی دو قسمتی در برابر یکدیگر قرار می‌دهد که به دو ربات چت اجازه می‌دهد الگوهای یکدیگر را یاد بگیرند و هر دستوری را در برابر موضوعات ممنوعه منحرف کنند.

ChatGPT در مقابل Google در گوشی‌های هوشمند. — DigitalTrends

این تیم شامل پروفسور لیو یانگ و Ph.D. از NTU دانش‌آموزان آقای دنگ گلی و لیو یی که در این تحقیق مشارکت داشتند و روش‌های حمله اثبات مفهومی را توسعه دادند که اساساً مانند هک بازیگر بد عمل می‌کنند.

به گفته این تیم، آنها ابتدا یک مدل زبان بزرگ (LLM) طراحی کردند تا مکانیسم های دفاعی آن را آشکار کنند. در ابتدا، آن‌ها بلوک‌های مدل بودند و اجازه نمی‌دادند که پاسخ‌ها به برخی اعلان‌ها یا کلمات به‌دلیل نیت خشونت‌آمیز، غیراخلاقی یا بدخواهانه به عنوان پاسخ منتقل شوند.

اما با این اطلاعات مهندسی معکوس، آنها می توانند به یک LLM مختلف نحوه ایجاد یک بای پس را آموزش دهند. با بای پس ایجاد شده، مدل دوم قادر خواهد بود با مهندسی معکوس مدل اول، خود را آزادتر بر اساس LLM بیان کند. تیم این فرآیند را “Masterkey” نامیده است زیرا حتی اگر چت ربات‌های LLM با امنیت بیشتری افزایش یابند یا در آینده وصله شوند، باید کار کند.

مطلب پیشنهادی: Infinix Zero 5G، Infinix Note 12i 2022 و ZeroBook Ultra India در این ماه تایید شدند: گزارش

فرآیند Masterkey ادعا می کند که سه برابر بهتر از دستورات در جیلبریک کردن چت بات ها است.

پروفسور لوئیس یانگ خاطرنشان کرد که ماهیت این فرآیند این است که نشان می دهد چت ربات های هوش مصنوعی LLM چگونه به راحتی می توانند یاد بگیرند و سازگار شوند. این تیم ادعا می کند که فرآیند Masterkey آن سه برابر موفق تر از یک فرآیند سریع سنتی در جیلبریک کردن چت ربات های LLM بوده است. به طور مشابه، برخی از کارشناسان استدلال می کنند که مشکلات اخیر پیشنهاد شده که برخی از LLM ها، مانند GPT-4، با آن مواجه هستند، نشانه هایی از پیشرفته تر شدن آنها است، نه احمقانه و تنبل تر، همانطور که برخی از منتقدان ادعا می کنند.

از آنجایی که چت ربات‌های هوش مصنوعی در اواخر سال 2022 با معرفی ChatGPT OpenAI محبوب شدند، فشار زیادی برای اطمینان از ایمن بودن سرویس‌های مختلف برای استفاده همگان انجام شد. OpenAI در هنگام ثبت نام و به روز رسانی های پراکنده هشدارهای ایمنی را روی محصول ChatGPT خود قرار داده است و در مورد خطاهای زبانی ناخواسته هشدار می دهد. در همین حال، اسپین‌آف‌های مختلف چت بات در اجازه دادن به توهین و زبان توهین‌آمیز تا حدی خوب ثابت شده‌اند.

علاوه بر این، بازیگران بد واقعی به سرعت شروع به استفاده از جستجوی ChatGPT، Google Bard و دیگر چت‌بات‌ها کردند، قبل از اینکه به طور گسترده در دسترس قرار گیرند. بسیاری از کمپین‌ها محصولات را در رسانه‌های اجتماعی با بدافزار متصل به پیوندهای تصویر، در میان حملات دیگر، تبلیغ کردند. به سرعت نشان داد که هوش مصنوعی مرز بعدی در جرایم سایبری است.

مطلب پیشنهادی: شما شوکه خواهید شد که چقدر این لپ تاپ 2 در 1 دل ارزان است

تیم تحقیقاتی NTU با ارائه دهندگان خدمات چت بات هوش مصنوعی درگیر در این مطالعه در مورد داده های اثبات مفهومی که نشان می دهد فرار از زندان چت بات واقعی است، تماس گرفت. این تیم همچنین یافته های خود را در سمپوزیوم امنیت شبکه و سیستم های توزیع شده در سن دیگو در ماه فوریه ارائه خواهد کرد.

توصیه های سردبیران

2024-01-04

0 2 دقیقه قبل خوانده شده

محققان به تازگی ChatGPT | را باز کرده اند گرایش های دیجیتال

دیدگاهتان را بنویسید لغو پاسخ

قالب وودمارت

Google Project Gameface مبتنی بر دسترسی را در اندروید راه‌اندازی می‌کند تا ناوبری بدون هندز را ارائه دهد

شرکت‌های هندی تا سال 2027 بیش از 5 میلیارد دلار برای فناوری هوش مصنوعی هزینه خواهند کرد: همه جزئیات

موتورولا Razr، Razr 50 Ultra Design پیش نمایش Surface Online; مشخصات Razr 50 لو رفت: تصاویر را ببینید

دولت در مورد کلاهبرداری های «دستگیری دیجیتالی» هشدار بزرگی صادر می کند – جزئیاتی که باید بدانید

4 ویژگی پیشرفته لپ‌تاپ‌های ویندوزی هنوز نسبت به مک‌بوک‌ها دارند

گوگل چیزی را ارائه کرده است که می تواند بزرگترین محصول سال های اخیر آنها باشد

اپل در حال ارائه یک ویژگی جدید برای کاهش بیماری حرکت برای کاربران آیفون و آیپد است

Samsung Galaxy Z Fold 6 در Geekbench ظاهر می شود. قرار است دوربین های بهتری نسبت به گلکسی اس 24 ارائه دهد

زن ساکن بمبئی به دلیل این کلاهبرداری جدید 54 میلیون روپیه به صورت آنلاین از دست می دهد – تمام جزئیاتی که باید بدانید

نوشته های مشابه

آیا پاک کننده رایانه شخصی جدید مایکروسافت فقط یک تبلیغ Edge است؟

چرا وقت آن است که یک تغییر اساسی در خط تولید مک بوک ایجاد شود

سیستم مورد نیاز سیستم کامپیوتر Horizon Forbidden West Complete Edition قبل از عرضه در 21 مارس تایید شده است.

درایورهای پردازنده گرافیکی Intel Arc در حال بهتر شدن هستند، اما این کار آسانی نیست

دیدگاهتان را بنویسید لغو پاسخ