یک سرویس جدید مبتنی بر هوش مصنوعی، پرتره ها را به سرهای سخنگو تبدیل می کند
سرویس جدید مبتنی بر هوش مصنوعی که میتواند پرترهها را به سر سخنگو تبدیل کند، روز دوشنبه توسط D-ID معرفی شد.
این اپلیکیشنهای سلفسرویس که Creative Reality Studio نامیده میشود، میتوانند تصویر یک چهره را به همراه گفتار به ویدیو تبدیل کنند.
هدف این سرویس سازندگان محتوای تجاری – واحدهای یادگیری و توسعه، بخشهای منابع انسانی، بازاریابان، تبلیغکنندگان و تیمهای فروش است، اما هر کسی میتواند این فناوری را در وبسایت D-ID امتحان کند.
استودیو واقعیت خلاق
ویدیوی جان پی ملو جونیور.
این پلتفرم هزینه و دردسر ایجاد محتوای ویدئویی شرکتی را کاهش میدهد و تنوع نامحدودی از ارائهدهندهها – در مقابل آواتارهای محدود – از جمله عکسهای خود کاربران یا هر تصویری که حق استفاده از آن را دارند، به گفته این شرکت، که با فناوری خود شهرت یافت، ارائه میکند. در اپلیکیشنی به نام Deep Nostalgia استفاده شد. این نرم افزار به عنوان راهی برای متحرک سازی پرتره های قدیمی معرفی شد.
این شرکت اضافه کرد که این فناوری به مشتریان و کاربران اجازه می دهد تا هویت مجری را از جمله قومیت، جنسیت، سن و حتی زبان، لهجه و لحن خود انتخاب کنند. در بیانیه خبری آمده است: «این نشاندهنده و تنوع بیشتری را ارائه میدهد، که منجر به احساس قویتر دربرگیری و تعلق میشود، و باعث ایجاد تعامل و تعامل بیشتر با کسبوکارهایی میشود که از آن استفاده میکنند».
متیو کرشاو، معاون بازاریابی D-ID به دیجیتال تو گفت: موارد استفاده شامل توانمندسازی سازندگان محتوای تجاری برای ادغام یکپارچه ویدیو در فضاهای دیجیتال و ارائه ها با افزونه انحصاری پاورپوینت، تولید محتوای جذاب تر با استفاده از راویان ویدیوی سازمانی سفارشی است.
خدمات چشمگیر
دانیل کاسترو، معاون بنیاد فناوری اطلاعات و نوآوری، یک سازمان تحقیقاتی و سیاست عمومی در واشنگتن دی سی، می گوید که کیفیت این خدمات بسیار چشمگیر است و همچنان در حال بهبود است.
او به دیجیتال تو گفت: “این سرویس در سطحی نیست که به طور کامل جایگزین ارائه کننده شود، اما دلیلی وجود ندارد که انتظار نداشته باشیم به زودی ظاهر شود.”
D-ID توضیح داد که استفاده از ویدیو توسط مشاغل به طور چشمگیری افزایش یافته است و تعداد بیشتری از آنها در حال ادغام آن در آموزش، ارتباطات و استراتژی های بازاریابی خود هستند.
او ادامه داد که این روند را تسریع میکند، جهانهای آواتارها و متاورس به سرعت در حال تکامل هستند، که هر دو رویکرد خلاقانهتر، فراگیرتر و تعاملیتر به محتوا را از سوی سازندگان دیجیتال میطلبد. با این حال، بودجه تولید می تواند بسیار گران باشد و نیاز به تخصیص قابل توجه زمان و استعداد دارد.
راس روبین، تحلیلگر اصلی در Reticle Research، یک شرکت مشاوره فناوری مصرفکننده در نیویورک، خاطرنشان کرد: این سرویس تکاملی از آواتارها و شکلکهایی است که امروزه مردم استفاده میکنند، اما میتوان از آن در یک بحث یا ارائه طولانیتر استفاده کرد.
او به دیجیتال تو گفت: “ایده این است که در زمان صرفه جویی کنید، به خصوص اگر قرار است فیلمنامه ای را بخوانید.” “این می تواند برای مخاطب جذاب تر از صوت یا تماشای اسلایدها باشد.”
دموکراتیک کردن هوش مصنوعی
مدیر عامل و یکی از بنیانگذاران D-ID، گیل پری، در یک بیانیه خبری خاطرنشان کرد که از فناوری این شرکت که به شرکت محدود شده است، برای تولید 100 میلیون ویدیو استفاده شده است.
او ادامه داد: “اکنون که ما پلتفرم واقعیت خلاقانه خود را برای سلف سرویس ارائه می دهیم، پتانسیل بسیار زیادی است.” “این به شرکت های بزرگتر، شرکت های کوچکتر و مترجمان آزاد به طور یکسان امکان ایجاد ویدیوهای سفارشی برای اهداف مختلف در مقیاس را می دهد.”
کرشاو افزود که فناوری D-ID خلاقیت را بیشتر دموکراتیک خواهد کرد. او گفت: “من می گویم “بیشتر” زیرا در واقع فناوری از قبل هنرها را برای چندین دهه دموکراتیک کرده است.”
«از ایجاد سینتی سایزر، سمپلر و ترتیبدهنده در موسیقی تا فتوشاپ و ایلاستریتور در عکاسی و تصویرسازی و همچنین ویرایش پرمیر و رومیزی و موشن گرافیک در تولید فیلم، توانایی ایجاد محصولات با کیفیت بالا در خارج از استودیوهای تخصصی پیشرفته. از دهه 1980 این اتفاق افتاده است.” “این فقط آخرین قسمت از این مجموعه طولانی مدت است.”
آویوا لیتان، تحلیلگر امنیت و حریم خصوصی در گارتنر با این نظر موافق است: «این قطعاً یک گام رو به جلو در دموکراتیزه کردن هوش مصنوعی است. او به دیجیتال تو گفت: «موارد استفاده زیادی در آموزش، مراقبت های بهداشتی و خرده فروشی وجود دارد. «این فقط یک راه بهتر برای برقراری ارتباط با مردم است. ما در حال تبدیل شدن به یک جامعه بصری تر هستیم. هیچ کس وقت ندارد چیزی بخواند.
نگرانی های عمیق
با نگرانی فزاینده در مورد استفاده از “جعل عمیق” برای انتشار اطلاعات نادرست و ارتقای مهندسی اجتماعی به ارتفاعات جدید، همیشه احتمال سوء استفاده در راه حل های رسانه مصنوعی جدید مانند D-ID وجود دارد.
کرشاو گفت: «همانند هر فناوری، فناوری ما میتواند توسط بازیگران بد برای شرارت استفاده شود، اما پلتفرم ما برای کسبوکارهای قانونی است که هیچ علاقهای به این نوع استفاده نخواهند داشت.
او ادامه داد: «علاوه بر این، ما عمیقاً دروغ نمیگوییم. ما صورت شخص دیگری را روی بدن شخص دیگری قرار نمی دهیم و سعی نمی کنیم کسی چیزی را که نگفته است بگوید.»
او افزود: «در پلتفرم D-ID، ما تدابیر حفاظتی متعددی را برای اطمینان از عدم استفاده از فناوری ما در این راه اعمال کردهایم. ما صدای افراد مشهور یا بدون اجازه هیچ شخصی را تولید نمی کنیم.
این شرکت همچنین توهین و اظهارات نژادپرستانه را فیلتر می کند و استفاده از این پلتفرم را برای ایجاد ویدیوهای سیاسی ممنوع می کند.
لیتان خاطرنشان کرد: “D-ID نرده های محافظ را روی پلت فرم خود قرار می دهد، اما همه ما می دانیم که نرده های محافظ هرگز کامل نیستند.”
او گفت: «این یک ابزار عالی برای انتشار اطلاعات نادرست است زیرا این سایتهای رسانههای اجتماعی برای تقلبهای عمیق آماده نیستند. «حتی اگر سایتهای رسانههای اجتماعی در شناسایی تقلبیهای عمیق خوب باشند، هرگز به اندازه کافی خوب نخواهند شد. مثل اسپم است. هرزنامه همیشه ارسال می شود. این نیز خواهد گذشت، اما عواقب بدتر خواهد بود.
نیاز مبدأ
لیتان معتقد است که تشخیص دیپ فیک در درازمدت یک پیشنهاد بازنده است. حتی امروزه، الگوریتمهای تشخیص معمولاً نمیتوانند بیش از 70 درصد جعلیهای عمیق را شناسایی کنند.
وی افزود که دشمنان مصمم با استفاده از شبکههای متخاصم مولد با تشخیص تقلبی عمیق همگام خواهند شد، به طوری که نرخ شناسایی در نهایت به 50 درصد کاهش مییابد.
او پیشبینی میکند که در سال 2023، 20 درصد از حملات موفقیتآمیز هک کردن حساب، از دیپفیک برای مهندسی اجتماعی کاربران برای تحویل دادههای حساس یا انتقال پول به حسابهای مجرمانه استفاده میکنند.
کرشاو گفت: «بسیاری از پادمانها باید در سراسر صنعت اجرا شوند، به همین دلیل است که ما همچنین با نهادهای صنعتی و تنظیمکنندهها برای معرفی پادمانهای قانونی کار میکنیم که صنعت را به طور کلی ایمنتر و قابل اعتمادتر میکند.» به طور خاص، ما معتقدیم که داشتن یک سیستم در سطح صنعت برای واترمارک کردن نامرئی محتوا از طریق استفاده از استگانوگرافی تقریباً همه مشکلات بالقوه را از بین می برد.
او خاطرنشان کرد: «شما میتوانید رسانهها را ببینید و با کلیک یک دکمه، منشأ آن، از کجا آمده و حاوی چه چیزی است را ببینید». شفافیت راه حل است.
کاسترو افزود: راههای زیادی برای مقابله با جعلی وجود دارد، اما مهمترین چیز دانستن منشأ و اصالت رسانهها است.