⏱ این مطلب چقدر از وقت شما را میگیرد؟
حدود 7 دقیقه
OpenAI، علیرغم گزارشهای اخیر مبنی بر ضرردهی ۱۲ میلیارد دلاری در سهماهه گذشته، همچنان با اشتیاق فراوان به معرفی ابزارهای نوین ادامه میدهد. این روند نشاندهنده تعهد عمیق شرکت به پیشتازی در حوزه هوش مصنوعی مولد است، حتی اگر این مسیر با چالشهای مالی بزرگی همراه باشد. جدیدترین محصول انقلابی این شرکت، مدل تولید ویدیوی هوش مصنوعی Sora است. این مدل که توانایی خلق ویدیوهای فوقالعاده واقعگرایانه بر اساس دستورات متنی (Prompt) را دارد، توجه جهانیان را به خود جلب کرده است. با این حال، بر اساس برآوردهای دقیق کارشناسان صنعت و تحلیلگران مالی، تولید محتوای ویدیویی توسط Sora هزینهای سرسامآور بر دوش OpenAI گذاشته و تخمین زده میشود که این شرکت روزانه ۱۵ میلیون دلار صرف زیرساختها و پردازشهای مورد نیاز برای این ابزار میکند. این رقم، بخش بزرگی از زیانهای عملیاتی جاری شرکت را تشکیل میدهد.
1. Sora: موفقیت ظاهری با بهای سنگین
از زمان انتشار نسخه آزمایشی و محدود Sora که تنها با دعوتنامه (Invite-Only) در دسترس بود، این اپلیکیشن موفقیت چشمگیری در جذب کاربران اولیه کسب کرد. جامعه کاربران اولیه، که شامل محققان، هنرمندان و توسعهدهندگان پیشرو هستند، با شور و اشتیاق اقدام به تولید و به اشتراکگذاری نمونههای خیرهکننده ساخت Sora کردند. این ابزار در هفته اول دسترسی به ۱ میلیون کاربر فعال رسید و بر اساس گزارشهای غیررسمی، تا تاریخ ۳۱ اکتبر (تاریخ تخمینی انتشار گستردهتر یا دسترسی اولیه محدود)، به ۴ میلیون دانلود (یا درخواست دسترسی) دست یافت.
اما پشت این آمار دانلود و جذابیت بصری خیرهکننده، هزینهای پنهان اما سنگین نهفته است. Sora روزانه میلیونها ویدیو، اغلب در قالب نمونههای کوتاه ۱۰ ثانیهای، تولید میکند. تحلیلگران مالی و متخصصان زیرساخت ابری، با در نظر گرفتن حجم محاسباتی لازم برای مدلهای Diffusion سهبعدی و زمانی، به برآورد قابل توجهی رسیدهاند. مجله فوربز و گزارشهای تحلیلی مرتبط، تخمین زدهاند که هزینه عملیاتی روزانه Sora بیش از ۱۵ میلیون دلار است. با ضرب این رقم در ۳۶۵ روز سال، این هزینه به بیش از ۵ میلیارد دلار در سال بالغ میشود. این رقم، به تنهایی از بودجه سالانه بسیاری از شرکتهای فناوری بزرگ فراتر میرود.
2. چگونه هزینه ۱۵ میلیون دلاری Sora محاسبه میشود؟
محاسبه هزینه عملیاتی Sora نیازمند درک تفاوت بنیادین آن با مدلهای متنی است. مدلهای زبانی بزرگ (LLMs) مانند GPT-4 یا حتی پیشبینیهای GPT-5، اساساً بر پردازش دادههای متنی و توالی کلمات تکیه دارند. اما مدلهای تولید ویدیو مانند Sora، باید با پیچیدگیهای محاسباتی بسیار بالاتری دست و پنجه نرم کنند.
2.1. پیچیدگی محاسباتی مدلهای ویدیویی
مدلهای ویدیویی پیشرفته نیاز به پردازش دادههای چهاربعدی (سه بعد فضایی + بُعد زمان) دارند. این بدان معناست که هر فریم باید با فریم قبلی و بعدی هماهنگ باشد تا تداوم و انسجام زمانی در ویدیو حفظ شود. این نیازمندی باعث میشود که حافظه مورد نیاز (VRAM) و توان پردازشی (FLOPs) مورد نیاز برای آموزش و استنتاج (Inference) به شدت افزایش یابد.
بر اساس تحلیل دادههای منتشر شده توسط OpenAI درباره معماری Sora (که مبتنی بر تبدیل دادههای ویدیویی به توکنهای فضایی-زمانی است)، تحلیلگران با استفاده از دادههای محدود مربوط به مصرف منابع در خوشههای پردازشی، به این نتیجه رسیدهاند که:
هزینه تولید هر ویدیو (۱۰ ثانیهای) توسط Sora حدود ۱.۳۰ دلار برآورد میشود.
برای مقایسه، وضعیت هزینهها به شرح زیر است:
- تولید متن توسط GPT-5 (پیشبینی): پردازش و تولید ۷۵۰ هزار کلمه متن ممکن است تنها حدود ۱۰ دلار هزینه داشته باشد.
- تولید ویدیو توسط Sora: تولید یک ویدیو ۱۰ ثانیهای، تقریباً معادل هزینه پردازش میلیونها توکن متنی است.
2.2. مدلسازی مصرف روزانه
برای رسیدن به رقم ۱۵ میلیون دلار، تحلیلگران از مدلسازی تقریبی بر اساس نرخ مشارکت کاربر استفاده کردهاند:
فرض کنید Sora حدود ۴.۵ میلیون کاربر فعال در سطح جهانی (شامل توسعهدهندگان، محققان و کاربران اولیه دسترسی محدود) دارد.
اگر فرض کنیم ۲۵ درصد از این کاربران روزانه فعال باشند (معادل ۱,۱۲۵,۰۰۰ کاربر فعال روزانه). و هر کاربر فعال به طور متوسط ۱۰ ویدیو در طول روز تولید کند (برای تست، ساخت نمونههای مختلف یا استفادههای آزمایشی).
3. استراتژی پشت پرده: چرا OpenAI این ضرر را میپذیرد؟
ادامه فعالیت با این حجم از ضرر عملیاتی (که شاید در سطح شرکت در حال حاضر بسیار بزرگتر از سود حاصل از سرویسهای موجود باشد)، نشاندهنده یک استراتژی جسورانه برای تسخیر بازار (Market Domination) توسط OpenAI است. این شرکت، که ساختار سرمایهگذاری خود را از یک سازمان غیرانتفاعی به یک نهاد با اهداف تجاری تغییر داده است، در فاز فعلی، بازده مالی کوتاهمدت را فدای تسلط بلندمدت میکند.
3.1. پذیرش ضرر برای کسب سهم بازار
این تاکتیک، مشابه استراتژی بسیاری از غولهای فناوری در مراحل اولیه نفوذ به بازار است. OpenAI با ارائه قابلیتهای پیشرو مانند Sora به صورت رایگان یا بسیار ارزان (در فاز بتا)، سهم بازار و پذیرش عمومی را به دست میآورد. هدف این است که قبل از رقبای اصلی (مانند گوگل با Veo یا شرکتهای کوچکتر)، استاندارد کیفیت و تجربه کاربری را تعریف کند.
3.2. کاهش نمایی هزینههای پردازش
OpenAI به خوبی میداند که هزینههای سختافزاری هوش مصنوعی به صورت نمایی کاهش خواهند یافت. سرمایهگذاری هنگفت امروز، تضمین کننده سودآوری در آینده است، زیرا هر پیشرفت در بهینهسازی تراشهها و الگوریتمها، تأثیر مضاعفی بر کاهش هزینههای جاری خواهد داشت.
تحلیلگران پیشبینی میکنند که با بهینهسازی مدلهای Tensor Core و بهبود معماری استنتاج:
- هزینه ساخت ویدیو با Sora تا سال آینده (نسبت به امروز) ۵ برابر ارزانتر خواهد شد.
- تا سال ۲۰۲۷، این هزینه سه برابر دیگر ارزانتر خواهد شد و به سطح قابل مدیریتتری برسد.
این کاهش هزینهها، امکان تجاریسازی گستردهتر Sora را فراهم خواهد کرد، جایی که کاربران یا شرکتها برای تولید محتوای طولانیتر و با کیفیت بالاتر هزینه پرداخت خواهند کرد و سودآوری محقق خواهد شد.
4. گنجینه دادههای بیبدیل: سرمایهگذاری بر روی دادههای آتی
یکی از مهمترین دلایلی که OpenAI حاضر به پذیرش زیان ۱۵ میلیون دلاری روزانه است، هدف استراتژیک جمعآوری دادههای آموزشی برای نسلهای بعدی مدلها است.
4.1. حلقهی بازخورد انسان در حلقه (Human-in-the-Loop)
ارائه رایگان یا بسیار ارزان Sora، یک هدف استراتژیک دیگر نیز دارد: جمعآوری حجم عظیمی از دادههای آموزشی برچسبگذاری شده توسط انسان.
هنگامی که کاربران با Sora تعامل میکنند، آنها مجموعهای از اقدامات زیر را انجام میدهند که برای OpenAI بسیار ارزشمند است:
- تولید پرامپتهای متنی توصیفی: کاربران تلاش میکنند با دقیقترین و خلاقانهترین زبان، آنچه را که میخواهند ببینند، توصیف کنند. این پرامپتها به مثابه “برچسبهای ورودی” بسیار غنی برای مدلهای آینده هستند.
- ارزیابی خروجی: کاربران ویدیوهایی را که کیفیت مطلوبی ندارند، رد میکنند و ویدیوهای موفق را به اشتراک میگذارند. این فرآیند، یک سیستم بازخورد ضمنی ایجاد میکند که برای تنظیم دقیق (Fine-tuning) مدلهای بعدی (مانند Sora-2 یا GPT-6 Video) حیاتی است.
OpenAI این تعاملات میلیاردها ثانیه تولید محتوا را به عنوان یک معدن طلا از دادههای ویدیویی که توسط انسان برچسبگذاری شدهاند، جمعآوری میکند. این دادهها، بهویژه ویدیوهایی که بر اساس دستورات پیچیده تولید شدهاند، دقیقا همان چیزی است که برای آموزش مدلهای فوق پیشرفتهتر در آینده، که نیاز به درک عمیقتر از نیت کاربر دارند، حیاتی است.
در واقع، OpenAI در حال حاضر پول زیادی را صرف پردازش میکند تا اطمینان حاصل کند که برای چندین سال آینده، دادههای لازم برای حفظ برتری مطلق خود در رقابت با سایر بازیگران بزرگ صنعت هوش مصنوعی را در اختیار داشته باشد. هزینه ۱۵ میلیون دلاری روزانه، پیشپرداختی برای حفظ موقعیت رهبری تکنولوژیک است.
5. مسیر پیش رو: از هزینه تا سودآوری
آینده Sora و مدلهای مشابه آن، مستقیماً به توانایی OpenAI در مقیاسپذیری زیرساخت و جذب کاربران سازمانی وابسته است.
مراحل آتی تجاریسازی
- لایه بندی قیمتگذاری: پس از فاز آزمایشی، OpenAI احتمالاً مدلهای چند لایهای معرفی خواهد کرد: سطح رایگان بسیار محدود (برای حفظ کاربران اولیه)، سطح استاندارد برای مصرفکنندگان (با محدودیتهای زمانی) و سطح سازمانی (Enterprise) با SLAهای تضمین شده و قیمتگذاری بر اساس مصرف واقعی (Pay-per-Use) که در آن هزینه ۱.۳۰ دلار در هر ویدیو به شدت تعدیل شده و به سوددهی میرسد.
- تولید محتوای کارآمدتر: با کاهش هزینههای سختافزاری و بهینهسازی الگوریتمی که در بالا ذکر شد، هزینه استنتاج به زیر ۱۰ سنت در هر ویدیو خواهد رسید که این امر، حاشیه سود را به شدت افزایش میدهد.
- ادغام در اکوسیستم: ادغام Sora در ابزارهای حرفهای ویرایش ویدیو، پلتفرمهای بازاریابی و تولید محتوای استریم، جریانهای درآمدی پایداری را تضمین خواهد کرد که در نهایت زیانهای اولیه را جبران خواهد نمود.
در نهایت، هزینه نجومی روزانه ۱۵ میلیون دلاری Sora، نشاندهنده ریسکپذیری عظیم و همزمان، سرمایهگذاری بلندمدت OpenAI برای تثبیت جایگاه خود به عنوان خالق نسل بعدی اینترنت و رسانههای تولید شده توسط هوش مصنوعی است.
