OpenAI GPT-4o “به طرز قابل توجهی انسانی” است، نمایش زنده نشان می دهد که چه کاری می تواند انجام دهد – تمام جزئیات
OpenAI GPT-4o را معرفی کرده است، آخرین و پیشرفته ترین تکرار مدل هوش مصنوعی خود که برای ایجاد تعاملات دیجیتالی به طرز قابل توجهی انسانی طراحی شده است. این به روز رسانی جدید با هدف بهبود قابل توجه تجربه کاربر، ارائه قابلیت های پیشرفته برای مخاطبان گسترده تر است.
تعامل با حالت صوتی بهبود یافته است
در طی این اعلامیه، تیم OpenAI حالت صدای جدید GPT-4o را به نمایش گذاشت که نوید یک توانایی مکالمه طبیعی و شبیه انسان را می دهد. این نسخه ی نمایشی ظرفیت ربات چت را برای مدیریت وقفه ها و تغییر پاسخ ها در زمان واقعی نشان می دهد و تعامل افزایش یافته آن را برجسته می کند.
همچنین بخوانید: OpenAI GPT-4o را با قابلیت های صدا، متن و تصویرسازی منتشر می کند – همه جزئیات را بیاموزید
مدیر ارشد فناوری میرا موراتی بر قابلیت دسترسی به این مدل تاکید کرد و خاطرنشان کرد که GPT-4o قدرت GPT-4 را به همه کاربران، از جمله کاربران در سطح رایگان، گسترش می دهد. موراتی در یک ارائه زنده، GPT-4o را با علامت “o” مخفف “Omni” به عنوان یک پیشرفت بزرگ در راحتی و سرعت توصیف کرد.
تظاهرات چشمگیر
تظاهرات شامل انواع ویژگی های چشمگیر بود. به عنوان مثال، دستیار صوتی ChatGPT به سرعت پاسخ میدهد و میتواند بدون از دست دادن انسجام قطع شود و پتانسیل خود را برای ایجاد تحول در تعاملات مبتنی بر هوش مصنوعی نشان میدهد. یک نسخه آزمایشی شامل یک درس تنفس عمیق در زمان واقعی است که برنامه ها را با راهنمایی عملی نشان می دهد.
همچنین بخوانید: OpenAI GPT-4o راه اندازی شد: 5 دلیل برای اینکه قوی ترین مدل هوش مصنوعی است و کارهایی که می توانید انجام دهید
GPT-4o: صداهای متعدد و ویژگی های عیب یابی
نکته برجسته دیگر توانایی ChatGPT برای خواندن یک داستان تولید شده توسط هوش مصنوعی با چندین صدا، از دراماتیک تا روباتیک، حتی آواز بود. همچنین، مهارتهای حل مسئله ChatGPT به نمایش گذاشته شد زیرا به کاربر کمک میکرد تا به جای پاسخگویی، از طریق یک معادله جبر تعاملی استفاده کند.
GPT-4o: عملکرد چشمان من باش
GPT-4o در نمایشی بهویژه قابلتوجه به نام «چشمهای من باش»، مناظر شهر و محیط اطراف را در زمان واقعی توصیف میکند و کمکهای دقیقی به افراد کم بینا ارائه میدهد. این ویژگی می تواند یک تغییر دهنده بازی برای دسترسی باشد.
قابلیت های چندوجهی و ترجمه زبان GPT-4o
GPT-4o همچنین توانایی های شخصیتی و مکالمه ای را در مقایسه با نسخه های قبلی بهبود یافته است. بهطور یکپارچه بین زبانها جابهجا میشد و ترجمههای بیدرنگ بین انگلیسی و ایتالیایی را ارائه میکرد و از دوربین تلفن برای خواندن یادداشتهای نوشته شده و تفسیر احساسات استفاده میکرد.
انتشار GPT-4o با کنفرانس توسعهدهندگان I/O آتی گوگل، که در آن انتظار میرود پیشرفتهای بیشتری در هوش مصنوعی تولید شود، همزمان است. OpenAI همچنین نسخه دسکتاپ ChatGPT را برای کاربران مک اعلام کرده است و نسخه ویندوز آن نیز در راه است. در ابتدا، دسترسی به کاربران پولی ارائه خواهد شد.
علاوه بر این، OpenAI قصد دارد دسترسی رایگان به GPT های سفارشی و فروشگاه GPT خود را با این ویژگی ها به تدریج در هفته های آینده در اختیار کاربران قرار دهد. عرضه قابلیتهای متن و تصویر GPT-4o برای کاربران پولی ChatGPT Plus و Team با دسترسی کاربران Enterprise در افق آغاز شده است. کاربران رایگان نیز به تدریج، مشروط به محدودیت سرعت، دسترسی خواهند داشت.
همچنین بخوانید: ChatGPT به آیفون می آید. تایید شده! اپل و OpenAI ممکن است به زودی قراردادی را قبل از عرضه iOS 18 امضا کنند
ویژگی های آینده
نسخه صوتی GPT-4o باید به زودی منتشر شود و کارایی آن را فراتر از تعاملات متنی افزایش دهد. توسعهدهندگان میتوانند مشتاقانه منتظر استفاده از حالتهای نوشتاری و تصویری GPT-4o باشند، با قابلیتهای صوتی و تصویری که انتظار میرود به زودی در اختیار گروهی از شرکای معتمد قرار گیرد.