OpenAI GPT-4o “به طرز قابل توجهی انسانی” است، نمایش زنده نشان می دهد که چه کاری می تواند انجام دهد – تمام جزئیات

2024-05-14

0 2 دقیقه قبل خوانده شده

OpenAI GPT-4o را معرفی کرده است، آخرین و پیشرفته ترین تکرار مدل هوش مصنوعی خود که برای ایجاد تعاملات دیجیتالی به طرز قابل توجهی انسانی طراحی شده است. این به روز رسانی جدید با هدف بهبود قابل توجه تجربه کاربر، ارائه قابلیت های پیشرفته برای مخاطبان گسترده تر است.

فهرست مطالب پنهان

تعامل با حالت صوتی بهبود یافته است

تظاهرات چشمگیر

GPT-4o: صداهای متعدد و ویژگی های عیب یابی

GPT-4o: عملکرد چشمان من باش

قابلیت های چندوجهی و ترجمه زبان GPT-4o

ویژگی های آینده

تعامل با حالت صوتی بهبود یافته است

در طی این اعلامیه، تیم OpenAI حالت صدای جدید GPT-4o را به نمایش گذاشت که نوید یک توانایی مکالمه طبیعی و شبیه انسان را می دهد. این نسخه ی نمایشی ظرفیت ربات چت را برای مدیریت وقفه ها و تغییر پاسخ ها در زمان واقعی نشان می دهد و تعامل افزایش یافته آن را برجسته می کند.

همچنین بخوانید: OpenAI GPT-4o را با قابلیت های صدا، متن و تصویرسازی منتشر می کند – همه جزئیات را بیاموزید

مدیر ارشد فناوری میرا موراتی بر قابلیت دسترسی به این مدل تاکید کرد و خاطرنشان کرد که GPT-4o قدرت GPT-4 را به همه کاربران، از جمله کاربران در سطح رایگان، گسترش می دهد. موراتی در یک ارائه زنده، GPT-4o را با علامت “o” مخفف “Omni” به عنوان یک پیشرفت بزرگ در راحتی و سرعت توصیف کرد.

تظاهرات چشمگیر

تظاهرات شامل انواع ویژگی های چشمگیر بود. به عنوان مثال، دستیار صوتی ChatGPT به سرعت پاسخ می‌دهد و می‌تواند بدون از دست دادن انسجام قطع شود و پتانسیل خود را برای ایجاد تحول در تعاملات مبتنی بر هوش مصنوعی نشان می‌دهد. یک نسخه آزمایشی شامل یک درس تنفس عمیق در زمان واقعی است که برنامه ها را با راهنمایی عملی نشان می دهد.

مطلب پیشنهادی: کدهای رستگاری آتش رایگان Garena برای 9 ژوئن: خارج شوید، اکنون آنها را رایگان دریافت کنید!

همچنین بخوانید: OpenAI GPT-4o راه اندازی شد: 5 دلیل برای اینکه قوی ترین مدل هوش مصنوعی است و کارهایی که می توانید انجام دهید

GPT-4o: صداهای متعدد و ویژگی های عیب یابی

نکته برجسته دیگر توانایی ChatGPT برای خواندن یک داستان تولید شده توسط هوش مصنوعی با چندین صدا، از دراماتیک تا روباتیک، حتی آواز بود. همچنین، مهارت‌های حل مسئله ChatGPT به نمایش گذاشته شد زیرا به کاربر کمک می‌کرد تا به جای پاسخگویی، از طریق یک معادله جبر تعاملی استفاده کند.

GPT-4o: عملکرد چشمان من باش

GPT-4o در نمایشی به‌ویژه قابل‌توجه به نام «چشم‌های من باش»، مناظر شهر و محیط اطراف را در زمان واقعی توصیف می‌کند و کمک‌های دقیقی به افراد کم بینا ارائه می‌دهد. این ویژگی می تواند یک تغییر دهنده بازی برای دسترسی باشد.

قابلیت های چندوجهی و ترجمه زبان GPT-4o

GPT-4o همچنین توانایی های شخصیتی و مکالمه ای را در مقایسه با نسخه های قبلی بهبود یافته است. به‌طور یکپارچه بین زبان‌ها جابه‌جا می‌شد و ترجمه‌های بی‌درنگ بین انگلیسی و ایتالیایی را ارائه می‌کرد و از دوربین تلفن برای خواندن یادداشت‌های نوشته شده و تفسیر احساسات استفاده می‌کرد.

انتشار GPT-4o با کنفرانس توسعه‌دهندگان I/O آتی گوگل، که در آن انتظار می‌رود پیشرفت‌های بیشتری در هوش مصنوعی تولید شود، همزمان است. OpenAI همچنین نسخه دسکتاپ ChatGPT را برای کاربران مک اعلام کرده است و نسخه ویندوز آن نیز در راه است. در ابتدا، دسترسی به کاربران پولی ارائه خواهد شد.

علاوه بر این، OpenAI قصد دارد دسترسی رایگان به GPT های سفارشی و فروشگاه GPT خود را با این ویژگی ها به تدریج در هفته های آینده در اختیار کاربران قرار دهد. عرضه قابلیت‌های متن و تصویر GPT-4o برای کاربران پولی ChatGPT Plus و Team با دسترسی کاربران Enterprise در افق آغاز شده است. کاربران رایگان نیز به تدریج، مشروط به محدودیت سرعت، دسترسی خواهند داشت.

مطلب پیشنهادی: ایده های ویژه هدیه روز ولنتاین: Vivo V25 5G تا Jabra Elite 4 Active، همه آنها را بررسی کنید

همچنین بخوانید: ChatGPT به آیفون می آید. تایید شده! اپل و OpenAI ممکن است به زودی قراردادی را قبل از عرضه iOS 18 امضا کنند

ویژگی های آینده

نسخه صوتی GPT-4o باید به زودی منتشر شود و کارایی آن را فراتر از تعاملات متنی افزایش دهد. توسعه‌دهندگان می‌توانند مشتاقانه منتظر استفاده از حالت‌های نوشتاری و تصویری GPT-4o باشند، با قابلیت‌های صوتی و تصویری که انتظار می‌رود به زودی در اختیار گروهی از شرکای معتمد قرار گیرد.

2024-05-14

0 2 دقیقه قبل خوانده شده

OpenAI GPT-4o “به طرز قابل توجهی انسانی” است، نمایش زنده نشان می دهد که چه کاری می تواند انجام دهد – تمام جزئیات

تعامل با حالت صوتی بهبود یافته است

تظاهرات چشمگیر

GPT-4o: صداهای متعدد و ویژگی های عیب یابی

GPT-4o: عملکرد چشمان من باش

قابلیت های چندوجهی و ترجمه زبان GPT-4o

ویژگی های آینده

دیدگاهتان را بنویسید لغو پاسخ

قالب وودمارت

Google Project Gameface مبتنی بر دسترسی را در اندروید راه‌اندازی می‌کند تا ناوبری بدون هندز را ارائه دهد

شرکت‌های هندی تا سال 2027 بیش از 5 میلیارد دلار برای فناوری هوش مصنوعی هزینه خواهند کرد: همه جزئیات

موتورولا Razr، Razr 50 Ultra Design پیش نمایش Surface Online; مشخصات Razr 50 لو رفت: تصاویر را ببینید

دولت در مورد کلاهبرداری های «دستگیری دیجیتالی» هشدار بزرگی صادر می کند – جزئیاتی که باید بدانید

4 ویژگی پیشرفته لپ‌تاپ‌های ویندوزی هنوز نسبت به مک‌بوک‌ها دارند

گوگل چیزی را ارائه کرده است که می تواند بزرگترین محصول سال های اخیر آنها باشد

اپل در حال ارائه یک ویژگی جدید برای کاهش بیماری حرکت برای کاربران آیفون و آیپد است

Samsung Galaxy Z Fold 6 در Geekbench ظاهر می شود. قرار است دوربین های بهتری نسبت به گلکسی اس 24 ارائه دهد

زن ساکن بمبئی به دلیل این کلاهبرداری جدید 54 میلیون روپیه به صورت آنلاین از دست می دهد – تمام جزئیاتی که باید بدانید

تعامل با حالت صوتی بهبود یافته است

تظاهرات چشمگیر

GPT-4o: صداهای متعدد و ویژگی های عیب یابی

GPT-4o: عملکرد چشمان من باش

قابلیت های چندوجهی و ترجمه زبان GPT-4o

ویژگی های آینده

نوشته های مشابه

ویندوز 11 مایکروسافت جلسات مجازی را با صدای مبتنی بر هوش مصنوعی و سایر ویژگی‌ها تغییر می‌دهد

CES 2024: تغییر زندگی! GyroGlove با تکنولوژی بالا لرزش را در بیماری پارکینسون متوقف می کند

نبرد نظارتی اروپا با اپل چگونه می‌تواند نشان دهد که چه چیزی برای مصرف‌کنندگان آمریکایی در راه است

Roscosmos: نشت از فضاپیمای روسی ناشی از برخورد خارجی

دیدگاهتان را بنویسید لغو پاسخ