تکنولوژی

یک سرویس جدید مبتنی بر هوش مصنوعی، پرتره ها را به سرهای سخنگو تبدیل می کند

سرویس جدید مبتنی بر هوش مصنوعی که می‌تواند پرتره‌ها را به سر سخنگو تبدیل کند، روز دوشنبه توسط D-ID معرفی شد.

این اپلیکیشن‌های سلف‌سرویس که Creative Reality Studio نامیده می‌شود، می‌توانند تصویر یک چهره را به همراه گفتار به ویدیو تبدیل کنند.

هدف این سرویس سازندگان محتوای تجاری – واحدهای یادگیری و توسعه، بخش‌های منابع انسانی، بازاریابان، تبلیغ‌کنندگان و تیم‌های فروش است، اما هر کسی می‌تواند این فناوری را در وب‌سایت D-ID امتحان کند.

استودیو واقعیت خلاق
ویدیوی جان پی ملو جونیور.


این پلتفرم هزینه و دردسر ایجاد محتوای ویدئویی شرکتی را کاهش می‌دهد و تنوع نامحدودی از ارائه‌دهنده‌ها – در مقابل آواتارهای محدود – از جمله عکس‌های خود کاربران یا هر تصویری که حق استفاده از آن را دارند، به گفته این شرکت، که با فناوری خود شهرت یافت، ارائه می‌کند. در اپلیکیشنی به نام Deep Nostalgia استفاده شد. این نرم افزار به عنوان راهی برای متحرک سازی پرتره های قدیمی معرفی شد.

این شرکت اضافه کرد که این فناوری به مشتریان و کاربران اجازه می دهد تا هویت مجری را از جمله قومیت، جنسیت، سن و حتی زبان، لهجه و لحن خود انتخاب کنند. در بیانیه خبری آمده است: «این نشان‌دهنده و تنوع بیشتری را ارائه می‌دهد، که منجر به احساس قوی‌تر دربرگیری و تعلق می‌شود، و باعث ایجاد تعامل و تعامل بیشتر با کسب‌وکارهایی می‌شود که از آن استفاده می‌کنند».

متیو کرشاو، معاون بازاریابی D-ID به دیجیتال تو گفت: موارد استفاده شامل توانمندسازی سازندگان محتوای تجاری برای ادغام یکپارچه ویدیو در فضاهای دیجیتال و ارائه ها با افزونه انحصاری پاورپوینت، تولید محتوای جذاب تر با استفاده از راویان ویدیوی سازمانی سفارشی است.

خدمات چشمگیر

دانیل کاسترو، معاون بنیاد فناوری اطلاعات و نوآوری، یک سازمان تحقیقاتی و سیاست عمومی در واشنگتن دی سی، می گوید که کیفیت این خدمات بسیار چشمگیر است و همچنان در حال بهبود است.

مطلب پیشنهادی:  Apple WWDC 2024: آنچه کاربران آیفون می توانند از آپدیت iOS 18 امسال انتظار داشته باشند

او به دیجیتال تو گفت: “این سرویس در سطحی نیست که به طور کامل جایگزین ارائه کننده شود، اما دلیلی وجود ندارد که انتظار نداشته باشیم به زودی ظاهر شود.”

D-ID توضیح داد که استفاده از ویدیو توسط مشاغل به طور چشمگیری افزایش یافته است و تعداد بیشتری از آنها در حال ادغام آن در آموزش، ارتباطات و استراتژی های بازاریابی خود هستند.

او ادامه داد که این روند را تسریع می‌کند، جهان‌های آواتارها و متاورس به سرعت در حال تکامل هستند، که هر دو رویکرد خلاقانه‌تر، فراگیرتر و تعاملی‌تر به محتوا را از سوی سازندگان دیجیتال می‌طلبد. با این حال، بودجه تولید می تواند بسیار گران باشد و نیاز به تخصیص قابل توجه زمان و استعداد دارد.

راس روبین، تحلیلگر اصلی در Reticle Research، یک شرکت مشاوره فناوری مصرف‌کننده در نیویورک، خاطرنشان کرد: این سرویس تکاملی از آواتارها و شکلک‌هایی است که امروزه مردم استفاده می‌کنند، اما می‌توان از آن در یک بحث یا ارائه طولانی‌تر استفاده کرد.

او به دیجیتال تو گفت: “ایده این است که در زمان صرفه جویی کنید، به خصوص اگر قرار است فیلمنامه ای را بخوانید.” “این می تواند برای مخاطب جذاب تر از صوت یا تماشای اسلایدها باشد.”

دموکراتیک کردن هوش مصنوعی

مدیر عامل و یکی از بنیانگذاران D-ID، گیل پری، در یک بیانیه خبری خاطرنشان کرد که از فناوری این شرکت که به شرکت محدود شده است، برای تولید 100 میلیون ویدیو استفاده شده است.

او ادامه داد: “اکنون که ما پلتفرم واقعیت خلاقانه خود را برای سلف سرویس ارائه می دهیم، پتانسیل بسیار زیادی است.” “این به شرکت های بزرگتر، شرکت های کوچکتر و مترجمان آزاد به طور یکسان امکان ایجاد ویدیوهای سفارشی برای اهداف مختلف در مقیاس را می دهد.”

کرشاو افزود که فناوری D-ID خلاقیت را بیشتر دموکراتیک خواهد کرد. او گفت: “من می گویم “بیشتر” زیرا در واقع فناوری از قبل هنرها را برای چندین دهه دموکراتیک کرده است.”

مطلب پیشنهادی:  استراتژی iOS 17 تغییر کرد! انتظار می رود ویژگی های خوبی برای آیفون داشته باشد

«از ایجاد سینتی سایزر، سمپلر و ترتیب‌دهنده در موسیقی تا فتوشاپ و ایلاستریتور در عکاسی و تصویرسازی و همچنین ویرایش پرمیر و رومیزی و موشن گرافیک در تولید فیلم، توانایی ایجاد محصولات با کیفیت بالا در خارج از استودیوهای تخصصی پیشرفته. از دهه 1980 این اتفاق افتاده است.” “این فقط آخرین قسمت از این مجموعه طولانی مدت است.”

آویوا لیتان، تحلیلگر امنیت و حریم خصوصی در گارتنر با این نظر موافق است: «این قطعاً یک گام رو به جلو در دموکراتیزه کردن هوش مصنوعی است. او به دیجیتال تو گفت: «موارد استفاده زیادی در آموزش، مراقبت های بهداشتی و خرده فروشی وجود دارد. «این فقط یک راه بهتر برای برقراری ارتباط با مردم است. ما در حال تبدیل شدن به یک جامعه بصری تر هستیم. هیچ کس وقت ندارد چیزی بخواند.

نگرانی های عمیق

با نگرانی فزاینده در مورد استفاده از “جعل عمیق” برای انتشار اطلاعات نادرست و ارتقای مهندسی اجتماعی به ارتفاعات جدید، همیشه احتمال سوء استفاده در راه حل های رسانه مصنوعی جدید مانند D-ID وجود دارد.

کرشاو گفت: «همانند هر فناوری، فناوری ما می‌تواند توسط بازیگران بد برای شرارت استفاده شود، اما پلتفرم ما برای کسب‌وکارهای قانونی است که هیچ علاقه‌ای به این نوع استفاده نخواهند داشت.

او ادامه داد: «علاوه بر این، ما عمیقاً دروغ نمی‌گوییم. ما صورت شخص دیگری را روی بدن شخص دیگری قرار نمی دهیم و سعی نمی کنیم کسی چیزی را که نگفته است بگوید.»

او افزود: «در پلتفرم D-ID، ما تدابیر حفاظتی متعددی را برای اطمینان از عدم استفاده از فناوری ما در این راه اعمال کرده‌ایم. ما صدای افراد مشهور یا بدون اجازه هیچ شخصی را تولید نمی کنیم.

این شرکت همچنین توهین و اظهارات نژادپرستانه را فیلتر می کند و استفاده از این پلتفرم را برای ایجاد ویدیوهای سیاسی ممنوع می کند.

مطلب پیشنهادی:  سفر ایلان ماسک به هند: تاییدیه های Starlink، کارخانه های تسلا و موارد دیگر در دستور کار

لیتان خاطرنشان کرد: “D-ID نرده های محافظ را روی پلت فرم خود قرار می دهد، اما همه ما می دانیم که نرده های محافظ هرگز کامل نیستند.”

او گفت: «این یک ابزار عالی برای انتشار اطلاعات نادرست است زیرا این سایت‌های رسانه‌های اجتماعی برای تقلب‌های عمیق آماده نیستند. «حتی اگر سایت‌های رسانه‌های اجتماعی در شناسایی تقلبی‌های عمیق خوب باشند، هرگز به اندازه کافی خوب نخواهند شد. مثل اسپم است. هرزنامه همیشه ارسال می شود. این نیز خواهد گذشت، اما عواقب بدتر خواهد بود.

نیاز مبدأ

لیتان معتقد است که تشخیص دیپ فیک در درازمدت یک پیشنهاد بازنده است. حتی امروزه، الگوریتم‌های تشخیص معمولاً نمی‌توانند بیش از 70 درصد جعلی‌های عمیق را شناسایی کنند.

وی افزود که دشمنان مصمم با استفاده از شبکه‌های متخاصم مولد با تشخیص تقلبی عمیق همگام خواهند شد، به طوری که نرخ شناسایی در نهایت به 50 درصد کاهش می‌یابد.

او پیش‌بینی می‌کند که در سال 2023، 20 درصد از حملات موفقیت‌آمیز هک کردن حساب، از دیپ‌فیک برای مهندسی اجتماعی کاربران برای تحویل داده‌های حساس یا انتقال پول به حساب‌های مجرمانه استفاده می‌کنند.

کرشاو گفت: «بسیاری از پادمان‌ها باید در سراسر صنعت اجرا شوند، به همین دلیل است که ما همچنین با نهادهای صنعتی و تنظیم‌کننده‌ها برای معرفی پادمان‌های قانونی کار می‌کنیم که صنعت را به طور کلی ایمن‌تر و قابل اعتمادتر می‌کند.» به طور خاص، ما معتقدیم که داشتن یک سیستم در سطح صنعت برای واترمارک کردن نامرئی محتوا از طریق استفاده از استگانوگرافی تقریباً همه مشکلات بالقوه را از بین می برد.

او خاطرنشان کرد: «شما می‌توانید رسانه‌ها را ببینید و با کلیک یک دکمه، منشأ آن، از کجا آمده و حاوی چه چیزی است را ببینید». شفافیت راه حل است.

کاسترو افزود: راه‌های زیادی برای مقابله با جعلی وجود دارد، اما مهم‌ترین چیز دانستن منشأ و اصالت رسانه‌ها است.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا