با DARKBert آشنا شوید، ابزار هوش مصنوعی آموزش دیده وب تاریک که می تواند با تهدیدات امنیت سایبری مقابله کند.
مدل های زبان بزرگ (LLM) در چند ماه گذشته محبوبیت زیادی به دست آورده اند، به خصوص با ظهور چت ربات های هوش مصنوعی مانند ChatGPT. این مدلهای مبتنی بر هوش مصنوعی میتوانند با یادگیری پایگاه داده موجود و مدلهای آموزشی برای تولید محتوای جدید و منحصر به فرد، محتوای جدیدی مانند متن، تصاویر، صدا و موارد دیگر تولید کنند. در حالی که از این ابزارها برای تولید محتوا با استفاده از هوش مصنوعی مولد استفاده شده است، محققان اکنون اولین LLM در نوع خود را برای ارزیابی و مبارزه با تهدیدات امنیت سایبری توسعه دادهاند. جالب اینجاست که این مدل فقط بر روی اطلاعات موجود در وب تاریک آموزش داده می شود.
DarKBERT چیست؟
DarkBERT یک مدل رمزگذار است که معماری RoBERTa را با تکیه بر ترانسفورماتورها اتخاذ می کند. محققان به جای آموزش در وب، این LLM را بر روی مجموعه داده عظیمی از صفحات وب تاریک آموزش دادند و اطلاعات را از مکان هایی مانند انجمن های هکرها، وب سایت های کلاهبرداری و سایر منابع اینترنتی مجرمانه جذب کردند. در مقاله ای به نام “DarkBERT: مدل زبانی برای سمت تاریک اینترنت” که در arxiv.org منتشر شده است، که هنوز مورد بررسی همتایان قرار نگرفته است، سازندگان آن می گویند DarKBERT می تواند با یافتن و تجزیه و تحلیل موارد گریزان، انقلابی در مبارزه با جرایم سایبری ایجاد کند. دامنه های اینترنت، که از دید موتورهای جستجو پنهان می مانند.
اگرچه وب تاریک معمولاً پنهان و برای عموم غیرقابل دسترس است، اما محققان از شبکه Tor برای دسترسی و جمع آوری داده ها از صفحات آن استفاده کرده اند. سپس دادهها تحت چندین فرآیند مانند حذف مجدد، متعادلسازی دستهها و پیشپردازش قرار گرفتند تا یک پایگاه داده پیشرفته وب تاریک ایجاد کنند، که در نهایت به RoBERTa داده شد، که منجر به ایجاد DarKBERT در مدت 15 روز شد.
برنامه های کاربردی امنیت سایبری
DarKBERT که بر روی مجموعه داده ای از صفحات وب تاریک آموزش دیده است، پتانسیل طیف گسترده ای از برنامه های کاربردی امنیت سایبری را دارد. می تواند به نظارت بر فعالیت های غیرقانونی و تقویت اقدامات امنیت سایبری کمک کند. بر اساس این مقاله تحقیقاتی، همچنین میتواند با تنوع واژگانی و ساختاری شدید Dark Web مبارزه کند، که میتواند برای ایجاد یک نمایش صحیح دامنه مضر باشد.
میتواند فرآیند نظارت بر انجمنهای وب تاریک را که در آن اطلاعات غیرقانونی معمولاً به اشتراک گذاشته میشود، خودکار کند. DarKBERT می تواند وب سایت هایی را که در افشای داده های حساس یا محرمانه و فروش باج افزار دخیل هستند را شناسایی کند.
در نهایت، از ویژگی تکمیل ماسک خانواده مدلهای زبان BERT برای شناسایی و فیلتر کردن عبارات مرتبط با فعالیتهای مجرمانه استفاده میکند که میتواند به شناسایی و مقابله با تهدیدات سایبری جدید کمک کند.