OpenAI برای شبیه سازی صدا به 15 ثانیه صدا نیاز دارد

2024-04-01

0 2 دقیقه قبل خوانده شده

در سال‌های اخیر، زمان گوش دادن مورد نیاز برای یک قطعه هوش مصنوعی برای شبیه‌سازی صدای یک نفر کوتاه‌تر و کوتاه‌تر شده است.

قبلا چند دقیقه بود، حالا فقط چند ثانیه.

OpenAI، شرکتی که توسط مایکروسافت پشتیبان چت ربات تولید کننده هوش مصنوعی ویروسی ChatGPT است، اخیراً فاش کرده است که فناوری شبیه‌سازی صدای اختصاصی آن تنها به ۱۵ ثانیه مواد صوتی برای بازتولید صدای دیگران نیاز دارد.

OpenAI در پستی در وب‌سایت خود، پیش‌نمایش کوچکی از مدلی به نام Voice Engine را که از اواخر سال ۲۰۲۲ در حال توسعه است، به اشتراک گذاشت.

موتور صوتی با تغذیه حداقل 15 ثانیه از مطالب گفتاری کار می کند. سپس کاربر می‌تواند متنی را برای ایجاد آنچه OpenAI به عنوان گفتار «احساسی و واقع‌گرایانه» توصیف می‌کند، وارد کند که «تقریباً شبیه سخنران اصلی است».

OpenAI اصرار دارد که “رویکردی محتاطانه و آگاهانه برای انتشار گسترده تر به دلیل احتمال سوء استفاده از صدای مصنوعی” اتخاذ می کند و اضافه می کند که می خواهد “گفتگویی را در مورد استقرار مسئولانه صداهای مصنوعی و چگونگی سازگاری جامعه با این قابلیت های جدید آغاز کند.” “”

وی افزود: بر اساس این گفتگوها و نتایج این آزمایشات در مقیاس کوچک، تصمیم آگاهانه تری در مورد اینکه آیا و چگونه این فناوری را در مقیاس اجرا کنیم، خواهیم گرفت.

یکی از سوء استفاده هایی که OpenAI به آن اشاره می کند، کلاهبرداری است که برخی از مجرمان در حال حاضر با استفاده از فناوری مشابهی که مدتی است در دسترس عموم قرار گرفته است، اجرا می کنند. این شامل شبیه سازی یک صدا و سپس تماس با دوست یا خویشاوند آن شخص برای فریب دادن آنها برای تحویل پول نقد از طریق انتقال سیمی است. همچنین نگرانی‌هایی در مورد نحوه استفاده از چنین فناوری در انتخابات ریاست‌جمهوری آتی وجود دارد، مسئله‌ای که با یک رویداد مهم اخیر که در آن یک تماس خودکار با استفاده از صدای پرزیدنت جو بایدن از مردم خواسته بود در انتخابات مقدماتی ایالات متحده رای ندهند، برجسته شد. نیوهمپشایر در ژانویه

مطلب پیشنهادی: Dell XPS 15 با RTX 4060 برای مدت محدودی 500 دلار تخفیف دارد

نگرانی دیگر این است که چگونه بهبود سریع فناوری بر معیشت صداپیشگان تأثیر می گذارد، زیرا می ترسند به طور فزاینده ای از آنها خواسته شود تا حقوق صدای خود را امضا کنند تا بتوان از هوش مصنوعی برای ایجاد یک نسخه مصنوعی استفاده کرد و احتمالاً جبران چنین قراردادی وجود دارد. بسیار پایین تر از زمانی باشد که از بازیگر خواسته شده بود که کار را شخصاً اجرا کند.

با نگاهی به پیاده‌سازی‌های مثبت‌تر این فناوری، OpenAI پیشنهاد می‌کند که می‌توان از آن برای ارائه کمک خواندن به غیرخوانندگان و کودکان با استفاده از صداهای طبیعی و عاطفی استفاده کرد که «حجم وسیع‌تری از سخنرانان را نسبت به صدای از پیش تعیین‌شده ممکن نشان می‌دهد». و همچنین ترجمه فوری ویدیوها و پادکست ها، چیزی که Spotify در حال آزمایش است.

همچنین می‌توان از آن برای کمک به بیمارانی که به‌تدریج به دلیل بیماری صدای خود را از دست می‌دهند کمک کرد تا با استفاده از صدای خودشان به برقراری ارتباط ادامه دهند.

OpenAI چند نمونه از صداهای تولید شده توسط هوش مصنوعی و صدای مرجع را در وب سایت خود دارد، و ما مطمئن هستیم که شما موافق خواهید بود، آنها بسیار خارق العاده هستند.

توصیه های سردبیران

2024-04-01

0 2 دقیقه قبل خوانده شده

OpenAI برای شبیه سازی صدا به 15 ثانیه صدا نیاز دارد

دیدگاهتان را بنویسید لغو پاسخ

قالب وودمارت

Google Project Gameface مبتنی بر دسترسی را در اندروید راه‌اندازی می‌کند تا ناوبری بدون هندز را ارائه دهد

شرکت‌های هندی تا سال 2027 بیش از 5 میلیارد دلار برای فناوری هوش مصنوعی هزینه خواهند کرد: همه جزئیات

موتورولا Razr، Razr 50 Ultra Design پیش نمایش Surface Online; مشخصات Razr 50 لو رفت: تصاویر را ببینید

دولت در مورد کلاهبرداری های «دستگیری دیجیتالی» هشدار بزرگی صادر می کند – جزئیاتی که باید بدانید

4 ویژگی پیشرفته لپ‌تاپ‌های ویندوزی هنوز نسبت به مک‌بوک‌ها دارند

گوگل چیزی را ارائه کرده است که می تواند بزرگترین محصول سال های اخیر آنها باشد

اپل در حال ارائه یک ویژگی جدید برای کاهش بیماری حرکت برای کاربران آیفون و آیپد است

Samsung Galaxy Z Fold 6 در Geekbench ظاهر می شود. قرار است دوربین های بهتری نسبت به گلکسی اس 24 ارائه دهد

زن ساکن بمبئی به دلیل این کلاهبرداری جدید 54 میلیون روپیه به صورت آنلاین از دست می دهد – تمام جزئیاتی که باید بدانید

نوشته های مشابه

سامسونگ الکترونیکس احتمالاً تقاضای تراشه را افزایش خواهد داد و بالاترین سود را از سال 2018 به دست خواهد آورد

iOS 16.5.1 (a) و macOS 13.4.1 (a) به‌روزرسانی‌های امنیتی واکنش سریع که ساعت‌ها پس از انتشار توسط اپل ارائه شد

چرا من در مورد هدست Apple Reality Pro هیجان زده (و نگران) هستم

گران ترین اپل ویژن پرو 4547 دلار قیمت دارد

دیدگاهتان را بنویسید لغو پاسخ