در ماههای اخیر، با افزایش چشمگیر تولید محتوای ویدئویی و صوتی توسط مدلهای هوش مصنوعی مانند Sora و Veo، تشخیص اصالت این محتواها به یک چالش بزرگ تبدیل شده است. گوگل در پاسخ به این نیاز، قابلیت جدید و پیشرفتهای را به مدل هوش مصنوعی خود، یعنی جمینای (Gemini)، اضافه کرده است تا کاربران بتوانند ویدیوهای مشکوک را بررسی کنند.
این ویژگی جدید، گامی مهم در جهت شفافیت دیجیتال محسوب میشود. با مغز افزار همراه باشید تا ببینیم این فناوری چگونه کار میکند.
1. تکنولوژی پنهان: واترمارک نامرئی SynthID
- قابلیت اصلی که جمینای برای تشخیص محتوای دستکاریشده از آن بهره میبرد، فناوری واترمارک نامرئی گوگل با نام SynthID است.
- زمانی که یک ویدیو (با محدودیت حجم ۱۰۰ مگابایت و مدت زمان ۹۰ ثانیه) در جمینای آپلود میشود، هوش مصنوعی با استفاده از SynthID، همهی فریمهای تصویر و همچنین لاین صوتی را برای یافتن این امضای دیجیتال اسکن میکند.
نکته مهم: پاسخ جمینای فراتر از یک «بله» یا «خیر» ساده است. این سیستم میتواند با دقت بسیار بالا مشخص کند که دقیقاً کدام بخش از محتوا (مثلاً بازه زمانی ۱۰ تا ۲۰ ثانیه از صدا) توسط هوش مصنوعی تولید یا دستکاری شده است. البته در حال حاضر، این قابلیت تنها برای محتوایی کار میکند که با ابزارهای داخلی خود گوگل (مانند Veo یا Imagen) تولید شده باشند.
2. چالشهای مقاومت در برابر حذف واترمارک
گوگل ادعا میکند که واترمارک SynthID به گونهای طراحی شده که «نامحسوس و مقاوم» است. با این حال، تجربیات نشان داده است که ویرایشهای سنگین، برشها، یا فشردهسازیهای شدید ممکن است این امضاهای دیجیتالی را از بین ببرند. همچنین، این سیستم فعلاً قادر به تشخیص خروجی مدلهای رقیب مانند Sora یا Kling نیست. با این وجود، جاسازی متادیتای استاندارد C2PA در فایلها، تلاشی مؤثر برای افزایش اعتماد در فضای دیجیتال است.
3. تعامل بصریتر با تصویرسازها: ورود Nano Banana
علاوه بر تشخیص محتوای ویدیویی، گوگل روش تعامل جدیدی را با مدل تصویرساز خود، Nano Banana، معرفی کرده است. این بهروزرسانی، کار با هوش مصنوعی بصری را متحول میکند. اکنون کاربران میتوانند مستقیماً روی تصویر آپلود شده نقاشی کنند یا یادداشتهای بصری بگذارند. به عنوان مثال، به جای نوشتن فرمان طولانی مانند «لطفاً رنگ کلاه این شخص را قرمز کن»، کافی است با قلم روی کلاه خط بکشید و کلمه «قرمز» را بنویسید. این ویژگی، سرعت و شهودی بودن فرآیند ویرایش توسط هوش مصنوعی را به شکل قابل توجهی افزایش میدهد.


