گوگل در حال اجرای یک بهروزرسانی هیجانانگیز برای کاربران هوش مصنوعی خود، Gemini است. این بهروزرسانی شامل ابزارهای جدید و پیشرفتهای برای ویرایش و تحلیل تصاویر است که تجربه کاربری را متحول خواهد کرد. این ویژگیهای نوآورانه در حال حاضر برای گروهی از کاربران در اپلیکیشن موبایل Gemini و همچنین نسخه وب آن در مرورگر کروم در حال آزمایش است.
1. قابلیتهای جدید: ابزار نشانهگذاری هوشمند Gemini
پلتفرم Gemini، که پیش از این با مدلهای تولید تصویر خود مانند Nano Banana و نسخه قدرتمندتر مبتنی بر Gemini 3 Pro توجهات زیادی را به خود جلب کرده بود، اکنون تمرکز خود را بر بهبود تعامل کاربر با محتوای بصری گذاشته است.
طبق گزارشها، قابلیت جدید کلیدی، «نشانهگذاری تصاویر» است. این ویژگی فرآیند ویرایش دقیق و بررسی جزئیات عکسها را به شکلی بسیار سادهتر و دقیقتر انجام میدهد:
- علامتگذاری بصری: پس از آپلود یک تصویر در چت Gemini، کاربران میتوانند با لمس تصویر، ابزارهای بصری برای حاشیهنویسی فعال کنند.
- ابزارهای ویرایش: این ابزارها شامل انتخاب رنگ برای ترسیم خطوط، رسم دایره، یا افزودن حاشیهنویسی متنی (Annotation) مستقیم روی تصویر است.
- دسترسی یکپارچه: این قابلیت شگفتانگیز نه تنها در اپلیکیشنهای موبایل، بلکه در نسخه دسکتاپ و وب نیز قابل استفاده است و تجربه تحلیل عمیق را در تمام پلتفرمها یکسان میسازد.
این ابزار به کاربران اجازه میدهد بخشهای خاصی از عکس را مشخص کرده و افراد یا اشیا موجود در آن را برجسته سازند؛ عملکردی که اگرچه تا حدی شبیه به قابلیت سادهتر Circle to Search است، اما سطح کنترل و جزئیات بیشتری را فراهم میآورد.

2. افزایش دقت تحلیل با کنترل کاربر محور
یکی از چالشهای اصلی مدلهای هوش مصنوعی در تحلیل تصاویر، گاهی اوقات عدم دقت در شناسایی کامل و بینقص اشیا یا افراد است. با معرفی ابزار نشانهگذاری، گوگل این نقص را به یک نقطه قوت تبدیل کرده است.
آزمایشها نشان میدهد که با استفاده از این ابزار نشانهگذاری، کاربران میتوانند دقیقاً بر بخش مورد نظر خود متمرکز شوند، و در نتیجه دقت تحلیل و اعمال تغییرات هدفمند بهطور چشمگیری افزایش مییابد. Gemini به صورت خودکار بخشهای مرتبط با ورودی کاربر را شناسایی میکند، اما توانایی کاربر برای اصلاح و هدایت تمرکز مدل، تضمینکننده نتایج دقیقتری خواهد بود.
این قابلیت که مدتهاست شواهد توسعه آن در نسخههای مختلف دیده میشد، اکنون در مرحله آزمایشی برای کاربران (حتی کاربران رایگان در نسخه 16.49.59 اپلیکیشن گوگل) فعال شده است.
با مغز افزار همراه باشید تا از جدیدترین نوآوریها در حوزه هوش مصنوعی و تحلیلهای بصری مطلع شوید. این تحول در ابزارهای Gemini، مرزهای جدیدی را در ویرایش و تعامل هوشمند با تصاویر دیجیتال ترسیم میکند.

