تکنولوژی

با DARKBert آشنا شوید، ابزار هوش مصنوعی آموزش دیده وب تاریک که می تواند با تهدیدات امنیت سایبری مقابله کند.

مدل های زبان بزرگ (LLM) در چند ماه گذشته محبوبیت زیادی به دست آورده اند، به خصوص با ظهور چت ربات های هوش مصنوعی مانند ChatGPT. این مدل‌های مبتنی بر هوش مصنوعی می‌توانند با یادگیری پایگاه داده موجود و مدل‌های آموزشی برای تولید محتوای جدید و منحصر به فرد، محتوای جدیدی مانند متن، تصاویر، صدا و موارد دیگر تولید کنند. در حالی که از این ابزارها برای تولید محتوا با استفاده از هوش مصنوعی مولد استفاده شده است، محققان اکنون اولین LLM در نوع خود را برای ارزیابی و مبارزه با تهدیدات امنیت سایبری توسعه داده‌اند. جالب اینجاست که این مدل فقط بر روی اطلاعات موجود در وب تاریک آموزش داده می شود.

DarKBERT چیست؟

DarkBERT یک مدل رمزگذار است که معماری RoBERTa را با تکیه بر ترانسفورماتورها اتخاذ می کند. محققان به جای آموزش در وب، این LLM را بر روی مجموعه داده عظیمی از صفحات وب تاریک آموزش دادند و اطلاعات را از مکان هایی مانند انجمن های هکرها، وب سایت های کلاهبرداری و سایر منابع اینترنتی مجرمانه جذب کردند. در مقاله ای به نام “DarkBERT: مدل زبانی برای سمت تاریک اینترنت” که در arxiv.org منتشر شده است، که هنوز مورد بررسی همتایان قرار نگرفته است، سازندگان آن می گویند DarKBERT می تواند با یافتن و تجزیه و تحلیل موارد گریزان، انقلابی در مبارزه با جرایم سایبری ایجاد کند. دامنه های اینترنت، که از دید موتورهای جستجو پنهان می مانند.

اگرچه وب تاریک معمولاً پنهان و برای عموم غیرقابل دسترس است، اما محققان از شبکه Tor برای دسترسی و جمع آوری داده ها از صفحات آن استفاده کرده اند. سپس داده‌ها تحت چندین فرآیند مانند حذف مجدد، متعادل‌سازی دسته‌ها و پیش‌پردازش قرار گرفتند تا یک پایگاه داده پیشرفته وب تاریک ایجاد کنند، که در نهایت به RoBERTa داده شد، که منجر به ایجاد DarKBERT در مدت 15 روز شد.

مطلب پیشنهادی:  ناسا می گوید این سیارک ماموت با عرض 290 فوت فردا به زمین نزدیک خواهد شد.

برنامه های کاربردی امنیت سایبری

DarKBERT که بر روی مجموعه داده ای از صفحات وب تاریک آموزش دیده است، پتانسیل طیف گسترده ای از برنامه های کاربردی امنیت سایبری را دارد. می تواند به نظارت بر فعالیت های غیرقانونی و تقویت اقدامات امنیت سایبری کمک کند. بر اساس این مقاله تحقیقاتی، همچنین می‌تواند با تنوع واژگانی و ساختاری شدید Dark Web مبارزه کند، که می‌تواند برای ایجاد یک نمایش صحیح دامنه مضر باشد.

می‌تواند فرآیند نظارت بر انجمن‌های وب تاریک را که در آن اطلاعات غیرقانونی معمولاً به اشتراک گذاشته می‌شود، خودکار کند. DarKBERT می تواند وب سایت هایی را که در افشای داده های حساس یا محرمانه و فروش باج افزار دخیل هستند را شناسایی کند.

در نهایت، از ویژگی تکمیل ماسک خانواده مدل‌های زبان BERT برای شناسایی و فیلتر کردن عبارات مرتبط با فعالیت‌های مجرمانه استفاده می‌کند که می‌تواند به شناسایی و مقابله با تهدیدات سایبری جدید کمک کند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا