تشخیص محتوای هوش مصنوعی توسط گوگل: جمینای چگونه ویدیوها و صداهای ساختگی را شناسایی می‌کند؟

در ماه‌های اخیر، با افزایش چشمگیر تولید محتوای ویدئویی و صوتی توسط مدل‌های هوش مصنوعی مانند Sora و Veo، تشخیص اصالت این محتواها به یک چالش بزرگ تبدیل شده است. گوگل در پاسخ به این نیاز، قابلیت جدید و پیشرفته‌ای را به مدل هوش مصنوعی خود، یعنی جمینای (Gemini)، اضافه کرده است تا کاربران بتوانند ویدیوهای مشکوک را بررسی کنند.

این ویژگی جدید، گامی مهم در جهت شفافیت دیجیتال محسوب می‌شود. با مغز افزار همراه باشید تا ببینیم این فناوری چگونه کار می‌کند.

1. تکنولوژی پنهان: واترمارک نامرئی SynthID

  • قابلیت اصلی  که جمینای برای تشخیص محتوای دستکاری‌شده از آن بهره می‌برد، فناوری واترمارک نامرئی گوگل با نام SynthID است.
  • زمانی که یک ویدیو (با محدودیت حجم ۱۰۰ مگابایت و مدت زمان ۹۰ ثانیه) در جمینای آپلود می‌شود، هوش مصنوعی با استفاده از SynthID، همه‌ی فریم‌های تصویر و همچنین لاین صوتی را برای یافتن این امضای دیجیتال اسکن می‌کند.

نکته مهم: پاسخ جمینای فراتر از یک «بله» یا «خیر» ساده است. این سیستم می‌تواند با دقت بسیار بالا مشخص کند که دقیقاً کدام بخش از محتوا (مثلاً بازه زمانی ۱۰ تا ۲۰ ثانیه از صدا) توسط هوش مصنوعی تولید یا دستکاری شده است. البته در حال حاضر، این قابلیت تنها برای محتوایی کار می‌کند که با ابزارهای داخلی خود گوگل (مانند Veo یا Imagen) تولید شده باشند.

2. چالش‌های مقاومت در برابر حذف واترمارک

گوگل ادعا می‌کند که واترمارک SynthID به گونه‌ای طراحی شده که «نامحسوس و مقاوم» است. با این حال، تجربیات نشان داده است که ویرایش‌های سنگین، برش‌ها، یا فشرده‌سازی‌های شدید ممکن است این امضاهای دیجیتالی را از بین ببرند. همچنین، این سیستم فعلاً قادر به تشخیص خروجی مدل‌های رقیب مانند Sora یا Kling نیست. با این وجود، جاسازی متادیتای استاندارد C2PA در فایل‌ها، تلاشی مؤثر برای افزایش اعتماد در فضای دیجیتال است.

3. تعامل بصری‌تر با تصویرسازها: ورود Nano Banana

علاوه بر تشخیص محتوای ویدیویی، گوگل روش تعامل جدیدی را با مدل تصویرساز خود، Nano Banana، معرفی کرده است. این به‌روزرسانی، کار با هوش مصنوعی بصری را متحول می‌کند. اکنون کاربران می‌توانند مستقیماً روی تصویر آپلود شده نقاشی کنند یا یادداشت‌های بصری بگذارند. به عنوان مثال، به جای نوشتن فرمان طولانی مانند «لطفاً رنگ کلاه این شخص را قرمز کن»، کافی است با قلم روی کلاه خط بکشید و کلمه «قرمز» را بنویسید. این ویژگی، سرعت و شهودی بودن فرآیند ویرایش توسط هوش مصنوعی را به شکل قابل توجهی افزایش می‌دهد.

برچسب ها :
مطالب مرتبط

Fusion؛ سلاح جدید OpenRouter برای شکست مدل‌های هوش مصنوعی

OpenRouter از Fusion رونمایی کرد؛  در حالی که بیشتر سرویس‌های هوش مصنوعی…

۲۵ خرداد ۱۴۰۵

GPT-5.6 در راه است؛ رونمایی نسل جدید ChatGPT نزدیک است!

 رونمایی OpenAI از GPT-5.6؛ نسل جدید ChatGPT گزارش‌های منتشرشده نشان می‌دهد OpenAI…

۲۳ خرداد ۱۴۰۵

MiMo Code؛ دستیار هوش مصنوعی کدنویسی شیائومی رونمایی شد

MiMo Code؛ دستیار هوش مصنوعی کدنویسی شیائومی با حافظه پایدار رونمایی شد…

۲۲ خرداد ۱۴۰۵

دیدگاهتان را بنویسید