GPT-4o: در دسترس بودن، قیمت، ویژگیها و موارد دیگر
GPT-4o جدیدترین و بهترین هوش مصنوعی مدل زبان بزرگ (LLM) است که توسط OpenAI منتشر شده است و هزاران ویژگی جدید را برای کاربران رایگان و پولی به همراه دارد. این هوش مصنوعی چندوجهی است و ChatGPT را با پاسخهای سریعتر، درک بهتر و تعدادی از قابلیتهای جدید بهبود میبخشد که در هفتههای آینده به کار خواهند رفت.
با افزایش رقابت از متا Llama 3 و Google's Gemini، آخرین نسخه OpenAI قصد دارد جلوتر از بازی باقی بماند. به همین دلیل است که بسیار هیجان انگیز است.
در دسترس بودن و قیمت
اگر مدتی است که از نسخه رایگان ChatGPT استفاده می کنید و به ویژگی هایی که کاربران ChatGPT Plus از آن لذت می برند چشم دوخته اید، خبر بسیار خوبی وجود دارد! همچنین اکنون می توانید با تشخیص تصویر، آپلود فایل ها، یافتن GPT های سفارشی در فروشگاه GPT، از حافظه برای ذخیره مکالمه خود در حین چت استفاده کنید تا مجبور نباشید خودتان را تکرار کنید، و داده ها را تجزیه و تحلیل کنید و محاسبات پیچیده را انجام دهید.
این همه در کنار هوش بالاتر مدل استاندارد GPT-4 است، که GPT-4o معادل آن است، حتی اگر از ابتدا به عنوان یک هوش مصنوعی چند وجهی آموزش دیده باشد. دلیل این امکان این است که اجرای GPT-4o از نظر محاسباتی بسیار ارزانتر است، به این معنی که به توکنهای کمتری نیاز دارد، که باعث میشود یک پایگاه کاربر گستردهتر از آن استفاده کند.
با این حال، کاربران رایگان به تعداد پیام هایی که می توانند در روز به GPT-4o ارسال کنند محدود خواهند شد. با رسیدن به این آستانه، به مدل GPT-3.5 هدایت خواهید شد.
خیلی سریعتره
GPT-4 از جهات مختلفی با GPT-3.5 متفاوت بود و سرعت یکی از آنها بود. GPT-4 حتی با پیشرفت آن در ماه های اخیر و معرفی GPT-4 Turbo بسیار بسیار کندتر بود. با این حال، GPT-4o تقریباً آنی است. این باعث میشود که پاسخهای متنی آن بسیار سریعتر و کاربردیتر باشد و مکالمات صوتی در زمان واقعیتر انجام میشود.
در حالی که سرعت پاسخگویی بیشتر شبیه یک ویژگی خوب به نظر می رسد تا یک تغییر دهنده بازی، این واقعیت که می توانید پاسخ ها را در زمان واقعی دریافت کنید، GPT-4o را به ابزاری بسیار کارآمد برای کارهایی مانند ترجمه و کمک مکالمه تبدیل می کند.
پشتیبانی صوتی پیشرفته
اگرچه GPT-4o در اولین کار خود فقط میتوانست با متن و تصاویر کار کند، اما از ابتدا به گونهای طراحی شده بود که از دستورات صوتی استفاده کند و بتواند با استفاده از صدا با کاربران تعامل داشته باشد. این بدان معناست که در جایی که GPT-4 می تواند صدا را بگیرد، آن را به متن تبدیل کند، به آن پاسخ دهد و سپس پاسخ متنی خود را به خروجی صوتی تبدیل کند، GPT-4o می تواند صدا را بشنود و به همان روش پاسخ دهد. با سرعت بهبود یافتهاش، میتواند به صورت مکالمهای بسیار بیشتر پاسخ دهد و میتواند جنبههای منحصربهفرد صدا مانند لحن، تمپو، حالت و غیره را درک کند.
GPT-4o میتواند بخندد، طعنهآمیز باشد، وقتی اشتباه میکند خودش را بگیرد، و اواسط جریان را تصحیح کند، و میتوانید او را در مکالمه قطع کنید بدون اینکه پاسخ او را از مسیر خارج کند. همچنین می تواند زبان های مختلف را بفهمد و به سرعت ترجمه کند و به عنوان یک ابزار ترجمه بلادرنگ قابل استفاده باشد. می تواند آواز بخواند – یا حتی با خودش دوئت کند.
این را می توان برای آماده سازی مصاحبه، آموزش آواز، مدیریت NPC های نقش آفرینی، گفتن داستان های دراماتیک قبل از خواب با صداها و شخصیت های مختلف، ایجاد دیالوگ صوتی برای پروژه بازی، گفتن جوک (و خنده در پاسخ به شما) و موارد دیگر استفاده کرد.
درک بهبود یافته
GPT-4o شما را بسیار بهتر از پیشینیان خود درک می کند، به خصوص اگر با آن صحبت کنید. می تواند لحن و هدف را بسیار بهتر بخواند، و اگر می خواهید آرام و دوستانه باشد، در تلاش برای روشن نگه داشتن مکالمه با شما شوخی می کند.
وقتی کد یا متن را تجزیه و تحلیل میکند، اهداف شما را بسیار بیشتر در نظر میگیرد و باعث میشود پاسخی را که میخواهید بهتر ارائه کند و به درخواستهای خاص کمتری نیاز داشته باشد. او در خواندن ویدئو و تصاویر بهتر است و باعث می شود دنیای اطراف خود را درک کند.
در چندین دمو، OpenAI به کاربران نشان داد که اتاقی را که در آن بودند با مدلهای GPT-4o تصویربرداری کردند و سپس آن را توصیف کردند. در یک ویدیو، هوش مصنوعی حتی فضای اتاق را به نسخه دیگری از خود توصیف می کند، که سپس بر اساس آن توضیحات، پاسخ های خاص خود را دارد.
برنامه دسکتاپ بومی برای macOS
هوش مصنوعی بومی ویندوز هنوز به یک Copilot بسیار محدود (در حال حاضر) محدود است، اما کاربران macOS به زودی می توانند از ChatGPT و مدل جدید GPT-4o آن مستقیماً از دسکتاپ استفاده کامل کنند. با یک برنامه دسکتاپ بومی جدید، ChatGPT در دسترس تر خواهد بود – و با یک رابط کاربری جدید برای راه اندازی – استفاده از آن را آسان تر از همیشه می کند.
این برنامه در روزهای آینده برای اکثر کاربران ChatGPT Plus در دسترس خواهد بود و در هفته های آینده برای کاربران رایگان عرضه خواهد شد. نسخه ویندوز برای اواخر امسال وعده داده شده است.
هنوز همه چیز آماده نیست
در زمان نگارش، تنها جنبه های GPT-4o که در دسترس عموم است، حالت های متن و تصویر است. هیچ پشتیبانی صوتی پیشرفته، هیچ درک ویدیویی در زمان واقعی وجود ندارد، و برنامه دسکتاپ macOS حداقل برای چند روز دیگر در دسترس همه نخواهد بود.
اما همه چیز می آید. این تغییرات و سایر ارتقاءهای هیجان انگیز برای ChatGPT تقریباً در گوشه و کنار هستند.
توصیه های سردبیران