هدف برنامه جدید هوش مصنوعی متا کمک به انسان ها و NPC ها برای صحبت است
متا (فیسبوک سابق) اولین عرضه هوش مصنوعی خود را از زمان انفجار صنعت نسل AI در اواخر سال 2022 رونمایی می کند.
انتظار میرود که تولیدکننده متن به صدا این برند، به نام Voicebox، معادل صدای ChatGPT باشد که پیامهای متنی را به نتایج نوشتاری دقیق پردازش میکند، و Dall-E، که آثار هنری واقعگرایانه را توسعه میدهد. به گفته Engadget، Voicebox به نوبه خود قادر به دریافت پیام های متنی و ایجاد کلیپ های صوتی خواهد بود.
پس از آموزش ژنراتور جدید در مورد بیش از 50000 ساعت صدای فیلتر نشده، از جمله گفتار عمومی و رونوشت به زبانهای انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی. Voicebox برای ایجاد نتایج در گفتار محاوره ای به زبان های مختلف موجود آماده شده است. متا همچنین ادعا می کند که مدل آنها نسبت به مدل های دیگر یک درصد بهبود در میزان خطا دارد.
به گفته محققان متا، این مدل با پیشبینی بلوکهای گفتار در رونویسی آموزش داده شده است، نه اینکه یک مجموعه کاری از ابتدا ایجاد کند. این ابزار همچنین دارای قابلیت ویرایش کلیپ های صوتی برای نویزهای ناخواسته یا کلمات اشتباه تلفظ شده است، مشابه نرم افزارهای ویرایش تصویر ثابت مانند Adobe Photoshop.
متا گفت که در حال حاضر برنامه ای برای انتشار عمومی برنامه Voicebox یا کد منبع به دلیل “خطرات احتمالی سوء استفاده” ندارد. این قابل درک است، زیرا اداره تحقیقات فدرال (FBI) اخیراً هشداری در مورد استفاده روزافزون از محتوای جعلی عمیق در جنایاتی از جمله اخاذی، اخاذی و آزار و اذیت صادر کرده است.
این شرکت نمونه های صوتی را با مقاله تحقیقاتی خود در معرفی اپلیکیشن منتشر کرد. همچنین جزئیات برنامههای بالقوه آینده برای کمک به بیماران مبتلا به آسیب تارهای صوتی، NPCهای درون بازی و دستیارهای دیجیتال را ارائه میکند.
متا در موقعیت جالب تلاش برای همگام شدن با روندهای فعلی صنعت است. اگرچه مدل های مختلفی از هدست متا کوئست واقعیت مجازی آن وجود دارد، به نظر می رسد که این شرکت دیگر با برنامه های خود برای تکامل مفهوم متاورس خود به نفع نوآوری های بیشتر هوش مصنوعی پیش نمی رود. در همین حال، اپل به تازگی از اولین هدست ویژن پرو خود رونمایی کرده و در حال سرمایه گذاری روی واقعیت مجازی است. در حال حاضر اپل علاقه زیادی به هوش مصنوعی نشان نداده است.
توصیه های سردبیران