كشفت شركة Google وStability AI عن نماذج ذكاء اصطناعي جديدة بإمكانها إنتاج مقاطع فيديو باستخدام صورة واحدة فقط.
ويتميز نموذج Google بتقديم فيديوهات تبدو واقعية للغاية، إذ يظهر في الفيديو شخص يتحدث بتعابير وجه واقعية ومقربة من الحقيقة. بالمقابل، قدمت الشركة الناشئة Stability AI فيديوهات ثلاثية الأبعاد تظهر فيديوهات من منظور بانورامي، مما يعطي تجربة تفاعلية ومشاهد متعددة الأبعاد.
ويشهد سوق نماذج الذكاء الاصطناعي، التي تركز على إنتاج الفيديوهات، تقدماً واسعاً في الفترة الأخيرة، وهذا بسبب الإبهار الذي أحدثه إعلان شركة OpenAI عن نموذجها الثوري Sora، الذي من المتوقع أن يصبح متاحاً بنهاية العام الحالي.
وكشفت Stability AI عن إطلاق نموذج جديد يحمل اسم “Stable Video 3D”، أو اختصاراً SV3D، والذي يمثل تطوراً في مجال إنشاء الفيديوهات ثلاثية الأبعاد.
ويتميز النموذج الجديد بالقدرة على إنتاج مقاطع فيديو ثلاثية الأبعاد باستخدام صورة واحدة فقط، ويعتمد على تقنية “Stable Video Diffusion” وزوايا عرض محددة للعناصر لتحقيق هذا الأمر.
ويتميز SV3D باهتلافه عن النماذج الحالية المتاحة في السوق، مثل نماذج Zero123 وZero123XL، إذ يقدم مستوى جديداً من التحكم في إنشاء مجسمات ثلاثية الأبعاد لعناصر مأخوذة من صور ثنائية الأبعاد. وبفضل هذه التقنية الجديدة، يمكن عرض العناصر المنشأة من أي زاوية تخيلية، مما يضيف مرونة وتفاعلية أكبر لتجربة المستخدم.
وترجع دقة إنشاء المجسمات ثلاثية الأبعاد من صورة واحدة إلى قدرة النموذج الجديد على تحسين مجال الإشعاع العصبي ثلاثي الأبعاد NeRF، إلى جانب رفع جودة إدراك النموذج لعلاقة المجسم 3D للعنصر مع الضوء، مما يعطي تصميماً أكثر واقعية خلال تحريكه بشكل دائري.
وأشارت الشركة إلى أن نموذجها الجديد متاح للاستخدام التجاري في عرض المنتجات المختلفة، لعملائها المشتركين في خدمتها Stability AI Membership.