تولید تصویر چت‌جی‌پی‌تی با قابلیت فکرکردن آپدیت شد

تولید تصویر چت‌جی‌پی‌تی در نسخه جدید خود هوشمندتر از همیشه شده است. اوپن‌ای‌آی به‌تازگی از به‌روزرسانی بزرگی برای ابزار ChatGPT Images 2.0 رونمایی کرده که اکنون به قابلیتی به نام «فکرکردن» مجهز است؛ ویژگی‌ای که به مدل امکان می‌دهد قبل از تولید تصویر، ساختار صحنه را تحلیل کند و حتی برای دریافت اطلاعات بیشتر در وب جست‌وجو انجام دهد.این نسخه که بر پایه مدل GPT Image 2 توسعه یافته، توانایی بیشتری در دنبال‌کردن دقیق دستورات کاربر، حفظ جزئیات و تولید متن داخل تصویر دارد. اوپن‌ای‌آی اعلام کرده که قابلیت‌های جدید فعلاً برای کاربران اشتراکی ChatGPT شامل نسخه‌های پلاس، پرو، بیزینس و اینترپرایز فعال شده‌اند.

قابلیت «فکرکردن» در تولید تصویر چه کار می‌کند؟

در نسخه جدید، چت‌جی‌پی‌تی پیش از تولید خروجی، ساختار تصویر را تحلیل می‌کند. این یعنی مدل می‌تواند تشخیص دهد چه اشیایی باید در صحنه حضور داشته باشند، ترکیب‌بندی چگونه باشد و حتی براساس فایل‌های آپلودشده، خروجی‌های بصری کاملاً هماهنگ ایجاد کند.

ساخت هم‌زمان چند تصویر هم سبک

یکی از ویژگی‌های مهم این آپدیت، امکان تولید حداکثر هشت تصویر مشابه در یک سبک ثابت است. این قابلیت برای کاربرانی که قصد ساخت کمیک، مانگا، طراحی فضاهای مختلف یا ساخت کاراکترهای سریالی دارند، کاربردی و حیاتی است. 

افزایش کیفیت خروجی‌ها و پشتیبانی بهتر از نوشتار

در این نسخه، کیفیت تصاویر به‌طور محسوسی افزایش یافته و اکنون می‌توان خروجی‌هایی با وضوح تا 2K دریافت کرد. نسبت تصویرهای متنوع از ۳:۱ تا ۱:۳ نیز در دسترس است و کاربران آزادی بیشتری در ساخت تصاویر هنری، تبلیغاتی یا گرافیکی دارند.عملکرد مدل در تولید متن داخل تصویر نیز ارتقا یافته است. اوپن‌ای‌آی اعلام کرده که اکنون چت‌جی‌پی‌تی در زبان‌های آسیایی مانند ژاپنی، کره‌ای، چینی، هندی و بنگالی دقت بیشتری دارد و خروجی‌ها کمتر دچار اشتباهات نوشتاری می‌شوند.

رقابت شدید ابزارهای تولید تصویر

چت‌جی‌پی‌تی سال گذشته ابزار تولید تصویر را معرفی کرده بود و در آپدیت قبلی شاهد افزایش سرعت تولید و ویرایش بودیم. اما با رقابت فشرده ابزارهای جدیدی مانند نانوبنانا پرو گوگل و MAI-Image-2 مایکروسافت، نسخه جدید تلاش می‌کند جایگاه ChatGPT را حفظ و تقویت کند.طبق اعلام رسمی، این قابلیت‌ها از امروز برای تمام کاربران ChatGPT و Codex در دسترس قرار گرفته و به‌تدریج برای نسخه‌های دیگر نیز فعال خواهد شد.
دنیای من بین نور مانیتور و اسکرول‌های بی‌پایان می‌گذره. میلیون‌ها کیلومتر مسیر رو تو دنیای داده‌ها طی کردم تا امروز بتونم در مغز افزار، هوش مصنوعی رو از زاویه‌ای متفاوت براتون کالبدشکافی کنم.
مطالب مرتبط

مایکروسافت Copilot+ را روی GPU آزمایش می‌کند

1. Copilot+ مایکروسافت روی GPU؛ یک آزمایش مهم و غیرمنتظره مایکروسافت مدت‌هاست…

شکایت گوگل از کلاهبرداران چینی که با جمینای هزاران سایت جعلی ساختند

1. ماجرا دقیقاً چیست؟ طبق گزارش‌های منتشرشده، گوگل علیه گروهی از کلاهبرداران…

Fusion؛ سلاح جدید OpenRouter برای شکست مدل‌های هوش مصنوعی

OpenRouter از Fusion رونمایی کرد؛  در حالی که بیشتر سرویس‌های هوش مصنوعی…

۲۵ خرداد ۱۴۰۵

دیدگاهتان را بنویسید