سلاح جوجل السري؟ تسريب نموذج الفيديو Gemini Omni قبل مؤتمر I/O

Fanch AIon 2 months ago

إنشاء فيديو بالذكاء الاصطناعي جوجل Gemini Omni ضد Seedance

يتغير مشهد الفيديو المدعوم بالذكاء الاصطناعي بسرعة فائقة. قبل أيام قليلة من مؤتمر Google I/O المرتقب، ظهر عملاق جديد على الساحة: Gemini Omni.

يشير هذا الاختراق "شامل الوسائط" (Omnimodal)، الذي لاحظه في البداية مجموعة مختارة من مستخدمي Gemini، إلى أن جوجل مستعدة لتحدي الهيمنة الحالية لنماذج مثل Seedance 2.0. إليك كل ما نعرفه عن هذا التسريب وما يعنيه لمستقبل إنشاء الفيديو بالذكاء الاصطناعي على منصات مثل Fanch AI.

من "Nano Banana" إلى "Omni Video"

وفقًا لمصادر داخلية، تشير جوجل إلى هذا داخليًا على أنه "لحظة Nano Banana" للفيديو. للتوضيح، كان "Nano Banana" هو الاسم الرمزي الداخلي لنموذج صدم الجميع سابقًا بقفزته الهائلة في جودة إنشاء الصور.

تلعب جوجل الآن نفس الورقة في مجال الفيديو. النتائج المبكرة مذهلة: أدخل أحد المستخدمين بنجاح مطالبة (Prompt): "أستاذ يكتب برهانًا في حساب المثلثات على سبورة، ويشرح كل خطوة بالتفصيل." عرض أستاذ حساب المثلثات Gemini Omni

يشير الاتساق الزمني والتدفق المنطقي في هذه التوليدات المبكرة إلى قفزة كبيرة مقارنة بالنسخ السابقة، مما يهدد بشكل مباشر الاحتكار الذي يحتفظ به Seedance 2.0.

تسريب حصري: Gemini Omni في العمل

لفهم هذه الضجة، يجب أن تراها بنفسك. يوجد أدناه مقطع الفيديو التجريبي المسرب الناتج عن أحدث إصدار من Gemini Omni:

لقطات مسربة حصرية لإنشاء فيديو عالي الدقة من Gemini Omni.

بينما كان Seedance 2.0 في الصدارة، فإن دمج Gemini Omni للتفكير المنطقي للنماذج اللغوية الكبيرة (LLM) مع انتشار الفيديو يمثل البداية الحقيقية لحرب الفيديو بالذكاء الاصطناعي.

ما هو Gemini Omni؟ (المواصفات المسربة)

يبدو أن Gemini Omni هو تطور لنموذج Veo، المدمج الآن بالكامل في نظام Gemini البيئي. على عكس الأدوات المستقلة، تم تصميم Omni ليكون متعدد الوسائط حقًا.

الميزات الرئيسية المسربة:

تحرير الفيديو عبر الدردشة: يمكن للمستخدمين تعديل مقاطع الفيديو من خلال اللغة الطبيعية - إزالة العلامات المائية، أو استبدال الكائنات، أو إعادة دمج مشاهد بأكملها عبر واجهة الدردشة.
مستويات الإصدار: تشير الشائعات إلى وجود إصدارين - Gemini Omni Flash (مُحسّن للسرعة) و Gemini Omni Pro (مُحسّن للجودة).
حصص صارمة: حاليًا، يخضع النموذج لاختبارات مقيدة للغاية. تشير بعض التقارير إلى أن إنشاء مقطعي فيديو فقط بجودة عالية يستهلك ما يقرب من 86٪ من الحصة اليومية للمستخدم.

توحيد النظام البيئي

اتجاه جوجل واضح: التوحيد. لا مزيد من Veo على جانب و Nano Banana على الجانب الآخر. من خلال دمج نماذج متخصصة في Gemini Omni، تقوم جوجل بإنشاء نظام واحد يفهم وينشئ النصوص والصور ومقاطع الفيديو في وقت واحد.

لماذا يهم هذا مستخدمي Fanch AI

في Fanch AI، نراقب هذه التطورات للتأكد من أن مستخدمينا لديهم دائمًا وصول إلى أحدث تقنيات الذكاء الاصطناعي. بينما تهدف جوجل إلى نظام بيئي مغلق مع حصص إنشاء صارمة، تظل Fanch AI المركز الشامل حيث يمكنك مقارنة الوسائط المدعومة بالذكاء الاصطناعي وإنشائها وتحسينها عبر نماذج مختلفة دون قيود.

هل سيقضي Gemini Omni على المنافسة؟ سنكتشف ذلك في مؤتمر Google I/O الأسبوع المقبل. شيء واحد مؤكد: إن "عصر الفيديو" الحقيقي للذكاء الاصطناعي قد وصل رسميًا.

ترقبوا مدونة Fanch AI للحصول على تحليل تقني كامل بعد الكلمة الرئيسية لمؤتمر Google I/O.