ميتا تطرح نموذجها الجديد لتوليد الفيديو بالذكاء الاصطناعي

05 أكتوبر 2024
Movie Gen نموذج توليد الصور الثالث لشركة ميتا (أرتور ويداك/ Getty)
+ الخط -

استمع إلى الملخص

اظهر الملخص
- أطلقت شركة ميتا واجهة الذكاء الاصطناعي "موفي جن" Movie Gen لإنشاء مقاطع فيديو بالصوت استنادًا إلى نصوص أو صور، وهي ثالث نموذج توليدي للشركة بعد نماذج سابقة في 2022 و2023.
- النموذج يخضع حاليًا للاختبار من قبل صانعي محتوى ومخرجين لتحسينه، ولم تُحدد ميتا موعدًا لطرحه للعامة، مع إمكانية استخدامه مستقبلاً عبر إنستغرام وفيسبوك وواتساب.
- "موفي جن" يتيح إنتاج وتحرير الفيديوهات وإضافة الصوت بناءً على طلبات باللغة اليومية، ويتفوق على نماذج مشابهة في السوق.

قدمت شركة ميتا، الجمعة، واجهة الذكاء الاصطناعي التوليدي الجديدة "موفي جن" Movie Gen التي تتيح إنشاء مقاطع فيديو بالصوت بالاستناد إلى نصوص أو صور، وهو ما تسمح به خدمات رائدة أخرى في الذكاء الاصطناعي. وباتت Movie Gen نموذج توليد الصور الثالث لشركة ميتا بعد نموذج أول في يوليو/تموز 2022، وثانٍ في نوفمبر/تشرين الثاني 2023.

لم تتح "ميتا" أيّاً من الواجهات الثلاث للعامة، إذ تخضع للاختبار في هذه المرحلة من صانعي محتوى ومخرجين يقوّمون Movie Gen ويساعدون في تحسين البرنامج.

ولم ترد "ميتا" على الفور على سؤال لوكالة فرانس برس بشأن موعد طرح Movie Gen. وبالإضافة إلى مقاطع الفيديو التوضيحية، نشرت الشركة الجمعة وثيقة بحثية تتضمن توصيفاً للنموذج الجديد.

نماذج اللغة هي برامج تعتمد على قواعد بيانات ضخمة، ما يسمح لها بإنشاء محتوى، من نص أو صورة أو فيديو أو صوت أو رمز معلوماتية، استجابة لطلب تمت صياغته باللغة اليومية. بإمكان Movie Gen إنتاج مقطع فيديو بناءً على طلب مكتوب، وأيضاً من صورة. كما يوفر وظائف تحرير لمقاطع فيديو موجودة. يتيح النموذج أيضاً إضافة مقطع صوتي إلى الفيديو، وفقاً للمبدأ نفسه القائم على الطلبات باللغة اليومية.

سوشيال ميديا
التحديثات الحية

في مقطع قصير نُشر على موقع "ميتا"، يكفي التلفظ بجملة واحدة لتعديل فيديو عبر إضافة مشاهد لسيارة رباعية الدفع في الصحراء مع صوت محرك هادر ونغمة غيتار.

وألمحت "ميتا" إلى أن نسخة Movie Gen قد تصبح متاحة للاستخدام يوماً ما عبر شبكتي إنستغرام وفيسبوك، أو حتى من خلال رسائل "واتساب".

وليست "ميتا" أول مشغل للذكاء الاصطناعي يطوّر نموذجاً لإنشاء الفيديو. وفي هذا الإطار، يتيح برنامج "رانواي" Runway، من شركة "رانواي إيه آي" Runway AI الناشئة، من خلال طلب مكتوب، إنشاء لقطة مدتها بضع ثوانٍ، أو تحويل سلسلة من الصور الثابتة إلى فيديو قصير، أو إعادة تشكيل تسلسل موجود لتحويله، على سبيل المثال، إلى صورة في لوحة فنية.

وفي فبراير/شباط، أطلقت "أوبن إيه آي" OpenAI أيضاً نسختها المسماة "سورا" Sora، بينما تعمل "غوغل" على نموذج يُسمّى "لوميير" Lumiere.

وتقول "ميتا" إن Movie Gen "يتفوق على نماذج القطاع المماثلة عند تقييم إنتاجها من جانب البشر".

(فرانس برس)

المساهمون