روزنامه واشنگتن پست در گزارشی تحقیقی، جزئیات جدیدی را درباره داده هایی که شرکت OpenAI برای آموزش مدل تولید محتوای ویدیویی خود با نام Sora به کار برده، منتشر کرده است. این مدل که به تازگی نسخه دوم آن معرفی شده، یکی از پیشرفته ترین دستاوردهای اخیر در حوزه هوش مصنوعی مولد محسوب می شود و توجه گسترده ای را در سطح جهانی برانگیخته است.
کوین شاول، کارشناس گرافیک هوش مصنوعی در واشنگتن پست، اعلام کرده است که OpenAI احتمالاً از داده های موجود در فضای آنلاین بدون کسب مجوز از صاحبان اصلی آنها استفاده کرده است.
این روزنامه در گزارش خود به اظهارات پیشین تیم بروکس، یکی از اعضای ارشد پروژه Sora در سال ۲۰۲۴ میلادی، اشاره می کند که گفته بود شرکت از تمامی داده های در دسترس، بدون هیچ گونه تغییر در ساختار اصلی آن ها بهره برده است.
در مقابل، OpenAI اعلام کرده است که به صورت کلی از داده ها و کلیپ های ویدیویی دردسترس عموم و مواردی که مجوز لازم برای استفاده از آن ها موجود بوده، استفاده کرده است؛ اما منبع دقیق این کلیپ ها را مشخص نکرده است.
گزارش واشنگتن پست یادآور می شود که این رویکرد مشابه همان شیوه ای است که OpenAI پیش تر برای آموزش مدل ChatGPT به کار گرفته بود؛ روشی که بر پایه گردآوری گسترده داده ها از منابع متنوع آنلاین استوار بود.
بازسازی ویدیوهای واقعی با دقت بالا
این گزارش شامل یک آزمایش عملی نیز بود که توسط تیم این روزنامه انجام شد. در این آزمایش، تلاش شد تا صدها کلیپ ویدیویی برگرفته از فیلم ها، سریال های تلویزیونی و ویدیوهای محبوب یوتیوب بازسازی شوند.
تیم تحقیقاتی موفق شد با استفاده از منابع شناخته شده، کلیپ هایی مشابه صحنه هایی از سریال پرطرفدار (Wednesday) تولید کند و همچنین لوگوهایی از شرکت های مطرحی مانند برادران وارنر و دریم ورکس بسازد.
توانایی مدل حتی به تولید ویدیوهایی مشابه بازی های ویدیویی محبوبی چون ماینکرفت و بازسازی شخصیت های کارتونی شناخته شده نیز گسترش یافته است؛ محتوایی که به وفور در یوتیوب یافت می شود.
علاوه بر این، Sora قادر بوده است ویدیوهایی با واترمارک و نشان شبکه های خبری بین المللی از جمله NBA و همچنین کلیپ هایی مشابه محتوای تیک تاک تولید کند.
در بخشی از گزارش آمده است که این مدل حتی توانسته رقص های محبوب تیک تاک را با دقتی بسیار بالا بازسازی کند؛ موضوعی که نشان می دهد داده های آموزشی آن شامل ویدیوهای منتشرشده در این پلتفرم نیز بوده است.
وابستگی Sora 2 به پلتفرم های ویدیویی
با معرفی نسخه دوم این مدل، یعنی Sora 2، که اکنون قادر به تولید صدا از روی کلیپ های ویدیویی است، مشخص شد که OpenAI برای توسعه این مدل به میزان قابل توجهی به داده های موجود در پلتفرم های پخش ویدیو متکی بوده است.
در هفته های اخیر، ویدیوهایی در فضای مجازی منتشر شده که در آن ها چهره های مشهور جهان در حال بیان جملاتی غیرواقعی دیده می شوند، اما صدای تولیدشده به طرز چشمگیری مشابه صدای واقعی آنان است.
گزارش واشنگتن پست تأکید می کند که نتفلیکس (Netflix) و توییچ (Twitch) هیچ یک مجوز استفاده از محتوای خود را برای آموزش مدل های OpenAI صادر نکرده اند.
وابستگی ۷۰ درصدی مدل ها به داده های یوتیوب
جوآنا ماترزینسکا، پژوهشگر دکتری در دانشگاه MIT و از متخصصان حوزه داده در مدل های هوش مصنوعی، در مطالعه ای که سال گذشته انجام داد، نشان داد که حدود ۷۰ درصد از کتابخانه های داده مورد استفاده برای آموزش این مدل ها از یوتیوب استخراج می شوند؛ موضوعی که مستقیماً با سیاست های استفاده از محتوای این پلتفرم در تضاد است.
این مسئله صرفاً محدود به OpenAI نیست؛ گزارش مذکور به شرکت انویدیا (Nvidia) و مدل Runway نیز اشاره می کند که برای آموزش نسخه نهایی خود از ویدیوهای یوتیوب بهره گرفته است. اما انویدیا بر پایبندی به حقوق تولیدکنندگان محتوا و رعایت سیاست های پلتفرم ها تأکید دارد.
گوگل نیز در یکی از پست های رسمی خود اعلام کرده بود که از ویدیوهای یوتیوب برای آموزش مدل های هوش مصنوعی خود استفاده می کند، اما این کار را با رعایت کامل مقررات و سیاست های پلتفرم انجام می دهد.
در همین راستا، جک مالون، سخنگوی رسمی یوتیوب، تصریح کرده است که هرگونه کپی برداری غیرمجاز از محتوای منتشرشده در این پلتفرم، نقض شرایط خدمات یوتیوب به شمار می رود.
Sora 2 و آموزش تعاملی کاربران
اوپن ای آی در گام بعدی تصمیم گرفته است رویکردی متفاوت در پیش گیرد. در نسخه دوم این مدل، یعنی Sora 2، بستری مشابه یک شبکه اجتماعی طراحی شده است تا کاربران بتوانند ویدیوهای تولیدشده خود را با دیگران به اشتراک بگذارند.
کاربران قادر خواهند بود ویدیوهای شخصی خود را برای آموزش مدل آپلود کنند. این ویدیوها می توانند با رضایت کاربران، به عنوان داده های عمومی در دسترس سایر کاربران و شرکت OpenAI قرار گیرند.
هرچند این روش تا حدی از شدت نگرانی های مرتبط با حقوق مالکیت محتوا می کاهد، اما همچنان پرسش اصلی بی پاسخ مانده است:
مدل اولیه Sora دقیقاً بر پایه چه داده هایی آموزش دیده و نسخه دوم آن تا چه اندازه به همان منابع متکی بوده است؟
سهشنبه 22 مهر 1404
itna.ir - 16 ساعت پیش
واشنگتن پست: OpenAI با ویدیوهای یوتیوب مدل Sora را آموزش داده است


پیش بینی قیمت دلار چهارشنبه ۲۳ مهر ۱۴۰۴ / سیگنالهای مساعد سیاسی دلار را عقب راند
- tejaratnews.com
گوگل فوتوز با الهام از اینستاگرام گزینههای بیشتری برای ویرایش متن ارائه میکند [تماشا کنید]
- Digiato
بازماندگی از تحصیل در سایه تبدیل شدن مدارس به بنگاه اقتصادی / رایگان نبودن آموزش، بزرگترین تهدید برای عدالت آموزشی
- tejaratnews.com
بانک آینده در صدر وامدهی به خودیها/ مانده تسهیلات اشخاص مرتبط بانکها از 307 هزار میلیارد تومان عبور کرد
- tejaratnews.com
پایان 7 سال پنهانکاری ناوگان سایه / نفتکشهای ایران به سوی شفافیت حرکت میکنند؟ + عکس
- tejaratnews.com
پیش بینی سود فولاد سیرجان ایرانیان / سیسکو در سال مالی 1404 چقدر سود میسازد؟ + جدول
- tejaratnews.com
عملکرد شبکه بانکی نسبت به سهمیه روزانه در پرداخت تسهیلات ازدواج بالغ بر ۱۰۲ درصد است
- tejaratnews.com![قدرتنمایی تراشه نورالینک؛ بیمار مبتلا به ALS با ذهن خود بازوی رباتیک را کنترل کرد [تماشا کنید]](/images/newhub-blank-news.png)
قدرتنمایی تراشه نورالینک؛ بیمار مبتلا به ALS با ذهن خود بازوی رباتیک را کنترل کرد [تماشا کنید]
- Digiato
قیمت تخمینی تولید اسنپدراگون ۸ الیت نسل ۵ احتمالاً باعث شود در خرید پرچمدار اندرویدی آینده خود تردید کنید
- toranji.ir
اتحاد دوباره سامسونگ و کوالکام؛ اسنپدراگون ۸ الیت نسل ۵ با لیتوگرافی ۲ نانومتری ساخته شد
- zoomit.ir
معمای افزایش صادرات نفت ایران در سپتامبر / نفت ایران در نظم اقتصادی جدید جهان توان بازیابی دارد؟
- tejaratnews.com
الگوریتمهای اعتیادآور زیر ذرهبین قانون؛ شکایت تاریخی نیویورک از متا، گوگل، اسنپ و بایتدنس
- itna.ir
جزئیات جدید از گوشی نوبیا Z80 اولترا / پرچمدار برند نوبیا با آیفون ایر رقابت خواهد کرد!
- tejaratnews.com
کدهای iOS 26.1 beta 3 فاش کرد: پشتیبانی از هوش مصنوعی های جدید به زودی به آیفون میآید
- zoomtech.ir
مایکروسافت حالت IE مرورگر اج را محدود کرد: هکرها از این قابلیت قدیمی به عنوان یک بک دور استفاده میکردند
- zoomtech.ir
EcoFlow Delta Pro Ultra X: باتری خانگی غول پیکری که خانه شما را هفته ها روشن نگه میدارد
- zoomtech.ir
bornanews.ir
citna.ir
Digiato
doctoreman.ir
e-estekhdam.com
farnet.ir
gadgetnews.ir
gooyait.com
healthmag.ir
ictpress.ir
itna.ir
itport.ir
itresan.com
musiceiranian.ir
sabairan.com
sakhtafzarmag.com
salamaneh.com
salamatnews.com
sanjesh.org
seeiran.ir
sobhanehonline.com
softgozar.com
tejaratbank.ir
tejaratnews.com
toranji.ir
winphone.ir
zoomit.ir
zoomtech.ir
⁞
citna.ir
Digiato
doctoreman.ir
e-estekhdam.com
farnet.ir
gadgetnews.ir
gooyait.com
healthmag.ir
ictpress.ir
itna.ir
itport.ir
itresan.com
musiceiranian.ir
sabairan.com
sakhtafzarmag.com
salamaneh.com
salamatnews.com
sanjesh.org
seeiran.ir
sobhanehonline.com
softgozar.com
tejaratbank.ir
tejaratnews.com
toranji.ir
winphone.ir
zoomit.ir
zoomtech.ir