انقلاب در ویرایش تصویر: گوگل Gemini ابزارهای نشانه‌گذاری پیشرفته برای تحلیل دقیق عکس‌ها را عرضه کرد

گوگل در حال اجرای یک به‌روزرسانی هیجان‌انگیز برای کاربران هوش مصنوعی خود، Gemini است. این به‌روزرسانی شامل ابزارهای جدید و پیشرفته‌ای برای ویرایش و تحلیل تصاویر است که تجربه کاربری را متحول خواهد کرد. این ویژگی‌های نوآورانه در حال حاضر برای گروهی از کاربران در اپلیکیشن موبایل Gemini و همچنین نسخه وب آن در مرورگر کروم در حال آزمایش است.


1. قابلیت‌های جدید: ابزار نشانه‌گذاری هوشمند Gemini

پلتفرم Gemini، که پیش از این با مدل‌های تولید تصویر خود مانند Nano Banana و نسخه قدرتمندتر مبتنی بر Gemini 3 Pro توجهات زیادی را به خود جلب کرده بود، اکنون تمرکز خود را بر بهبود تعامل کاربر با محتوای بصری گذاشته است.

طبق گزارش‌ها، قابلیت جدید کلیدی، «نشانه‌گذاری تصاویر» است. این ویژگی فرآیند ویرایش دقیق و بررسی جزئیات عکس‌ها را به شکلی بسیار ساده‌تر و دقیق‌تر انجام می‌دهد:

  1. علامت‌گذاری بصری: پس از آپلود یک تصویر در چت Gemini، کاربران می‌توانند با لمس تصویر، ابزارهای بصری برای حاشیه‌نویسی فعال کنند.
  2. ابزارهای ویرایش: این ابزارها شامل انتخاب رنگ برای ترسیم خطوط، رسم دایره، یا افزودن حاشیه‌نویسی متنی (Annotation) مستقیم روی تصویر است.
  3. دسترسی یکپارچه: این قابلیت شگفت‌انگیز نه تنها در اپلیکیشن‌های موبایل، بلکه در نسخه دسکتاپ و وب نیز قابل استفاده است و تجربه تحلیل عمیق را در تمام پلتفرم‌ها یکسان می‌سازد.

این ابزار به کاربران اجازه می‌دهد بخش‌های خاصی از عکس را مشخص کرده و افراد یا اشیا موجود در آن را برجسته سازند؛ عملکردی که اگرچه تا حدی شبیه به قابلیت ساده‌تر Circle to Search است، اما سطح کنترل و جزئیات بیشتری را فراهم می‌آورد.

2. افزایش دقت تحلیل با کنترل کاربر محور

یکی از چالش‌های اصلی مدل‌های هوش مصنوعی در تحلیل تصاویر، گاهی اوقات عدم دقت در شناسایی کامل و بی‌نقص اشیا یا افراد است. با معرفی ابزار نشانه‌گذاری، گوگل این نقص را به یک نقطه قوت تبدیل کرده است.

آزمایش‌ها نشان می‌دهد که با استفاده از این ابزار نشانه‌گذاری، کاربران می‌توانند دقیقاً بر بخش مورد نظر خود متمرکز شوند، و در نتیجه دقت تحلیل و اعمال تغییرات هدفمند به‌طور چشمگیری افزایش می‌یابد. Gemini به صورت خودکار بخش‌های مرتبط با ورودی کاربر را شناسایی می‌کند، اما توانایی کاربر برای اصلاح و هدایت تمرکز مدل، تضمین‌کننده نتایج دقیق‌تری خواهد بود.

این قابلیت که مدت‌هاست شواهد توسعه آن در نسخه‌های مختلف دیده می‌شد، اکنون در مرحله آزمایشی برای کاربران (حتی کاربران رایگان در نسخه 16.49.59 اپلیکیشن گوگل) فعال شده است.

با مغز افزار همراه باشید تا از جدیدترین نوآوری‌ها در حوزه هوش مصنوعی و تحلیل‌های بصری مطلع شوید. این تحول در ابزارهای Gemini، مرزهای جدیدی را در ویرایش و تعامل هوشمند با تصاویر دیجیتال ترسیم می‌کند.

برچسب ها :
مطالب مرتبط

GPT-5.6 در راه است؛ رونمایی نسل جدید ChatGPT نزدیک است!

 رونمایی OpenAI از GPT-5.6؛ نسل جدید ChatGPT گزارش‌های منتشرشده نشان می‌دهد OpenAI…

۲۳ خرداد ۱۴۰۵

MiMo Code؛ دستیار هوش مصنوعی کدنویسی شیائومی رونمایی شد

MiMo Code؛ دستیار هوش مصنوعی کدنویسی شیائومی با حافظه پایدار رونمایی شد…

۲۲ خرداد ۱۴۰۵

پیشرفته‌ترین مدل هوش مصنوعی آفلاین اپل روی کدام آیفون‌ها اجرا می‌شود؟

1. هوش مصنوعی آفلاین اپل روی کدام آیفون‌ها اجرا می‌شود؟ اپل همیشه…

دیدگاهتان را بنویسید