تکنولوژی

OpenAI GPT-4o “به طرز قابل توجهی انسانی” است، نمایش زنده نشان می دهد که چه کاری می تواند انجام دهد – تمام جزئیات

OpenAI GPT-4o را معرفی کرده است، آخرین و پیشرفته ترین تکرار مدل هوش مصنوعی خود که برای ایجاد تعاملات دیجیتالی به طرز قابل توجهی انسانی طراحی شده است. این به روز رسانی جدید با هدف بهبود قابل توجه تجربه کاربر، ارائه قابلیت های پیشرفته برای مخاطبان گسترده تر است.

تعامل با حالت صوتی بهبود یافته است

در طی این اعلامیه، تیم OpenAI حالت صدای جدید GPT-4o را به نمایش گذاشت که نوید یک توانایی مکالمه طبیعی و شبیه انسان را می دهد. این نسخه ی نمایشی ظرفیت ربات چت را برای مدیریت وقفه ها و تغییر پاسخ ها در زمان واقعی نشان می دهد و تعامل افزایش یافته آن را برجسته می کند.

همچنین بخوانید: OpenAI GPT-4o را با قابلیت های صدا، متن و تصویرسازی منتشر می کند – همه جزئیات را بیاموزید

مدیر ارشد فناوری میرا موراتی بر قابلیت دسترسی به این مدل تاکید کرد و خاطرنشان کرد که GPT-4o قدرت GPT-4 را به همه کاربران، از جمله کاربران در سطح رایگان، گسترش می دهد. موراتی در یک ارائه زنده، GPT-4o را با علامت “o” مخفف “Omni” به عنوان یک پیشرفت بزرگ در راحتی و سرعت توصیف کرد.

تظاهرات چشمگیر

تظاهرات شامل انواع ویژگی های چشمگیر بود. به عنوان مثال، دستیار صوتی ChatGPT به سرعت پاسخ می‌دهد و می‌تواند بدون از دست دادن انسجام قطع شود و پتانسیل خود را برای ایجاد تحول در تعاملات مبتنی بر هوش مصنوعی نشان می‌دهد. یک نسخه آزمایشی شامل یک درس تنفس عمیق در زمان واقعی است که برنامه ها را با راهنمایی عملی نشان می دهد.

مطلب پیشنهادی:  جف بزوس و اندی جاسی از آمازون ممکن است مجبور شوند در تحقیقات FTC شهادت دهند.

همچنین بخوانید: OpenAI GPT-4o راه اندازی شد: 5 دلیل برای اینکه قوی ترین مدل هوش مصنوعی است و کارهایی که می توانید انجام دهید

GPT-4o: صداهای متعدد و ویژگی های عیب یابی

نکته برجسته دیگر توانایی ChatGPT برای خواندن یک داستان تولید شده توسط هوش مصنوعی با چندین صدا، از دراماتیک تا روباتیک، حتی آواز بود. همچنین، مهارت‌های حل مسئله ChatGPT به نمایش گذاشته شد زیرا به کاربر کمک می‌کرد تا به جای پاسخگویی، از طریق یک معادله جبر تعاملی استفاده کند.

GPT-4o: عملکرد چشمان من باش

GPT-4o در نمایشی به‌ویژه قابل‌توجه به نام «چشم‌های من باش»، مناظر شهر و محیط اطراف را در زمان واقعی توصیف می‌کند و کمک‌های دقیقی به افراد کم بینا ارائه می‌دهد. این ویژگی می تواند یک تغییر دهنده بازی برای دسترسی باشد.

قابلیت های چندوجهی و ترجمه زبان GPT-4o

GPT-4o همچنین توانایی های شخصیتی و مکالمه ای را در مقایسه با نسخه های قبلی بهبود یافته است. به‌طور یکپارچه بین زبان‌ها جابه‌جا می‌شد و ترجمه‌های بی‌درنگ بین انگلیسی و ایتالیایی را ارائه می‌کرد و از دوربین تلفن برای خواندن یادداشت‌های نوشته شده و تفسیر احساسات استفاده می‌کرد.

انتشار GPT-4o با کنفرانس توسعه‌دهندگان I/O آتی گوگل، که در آن انتظار می‌رود پیشرفت‌های بیشتری در هوش مصنوعی تولید شود، همزمان است. OpenAI همچنین نسخه دسکتاپ ChatGPT را برای کاربران مک اعلام کرده است و نسخه ویندوز آن نیز در راه است. در ابتدا، دسترسی به کاربران پولی ارائه خواهد شد.

علاوه بر این، OpenAI قصد دارد دسترسی رایگان به GPT های سفارشی و فروشگاه GPT خود را با این ویژگی ها به تدریج در هفته های آینده در اختیار کاربران قرار دهد. عرضه قابلیت‌های متن و تصویر GPT-4o برای کاربران پولی ChatGPT Plus و Team با دسترسی کاربران Enterprise در افق آغاز شده است. کاربران رایگان نیز به تدریج، مشروط به محدودیت سرعت، دسترسی خواهند داشت.

مطلب پیشنهادی:  یک کشف انقلابی! روشی برای مطالعه طوفان های خورشیدی قدرتمند کشف شد

همچنین بخوانید: ChatGPT به آیفون می آید. تایید شده! اپل و OpenAI ممکن است به زودی قراردادی را قبل از عرضه iOS 18 امضا کنند

ویژگی های آینده

نسخه صوتی GPT-4o باید به زودی منتشر شود و کارایی آن را فراتر از تعاملات متنی افزایش دهد. توسعه‌دهندگان می‌توانند مشتاقانه منتظر استفاده از حالت‌های نوشتاری و تصویری GPT-4o باشند، با قابلیت‌های صوتی و تصویری که انتظار می‌رود به زودی در اختیار گروهی از شرکای معتمد قرار گیرد.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا