أعلنت «غوغل» خلال مؤتمر «I/O 2025» عن العديد من التقنيات الحديثة، من بينها نموذج «Veo 3» الذي يستخدم الذكاء الاصطناعي لصنع الفيديوهات.
وأشارت «غوغل» خلال المؤتمر إلى أن نموذج «Veo 3» الجديد جاء أكثر تطورا بكثير مقارنة بنموذج «Veo 2»، فهو لا ينشئ مقاطع الصور فحسب، بل يدعم هذه المقاطع بمؤثرات صوتية مميزة.
يمكن لخوارزميات هذا النموذج إنشاء مؤثرات صوتية وضوضاء خلفية وحتى حوارات ومزامنتها مع الصور، وما يميزه هو قدرته على تحليل الصور بشكل دقيق ومزامنتها مع الأصوات للحصول على مقاطع فيديو عالية الجودة.
ولم تعلن «غوغل» عن المصادر التي استخدمتها في تدريب «Veo 3»، لكن التسريبات تشير إلى أنها اعتمدت على فيديوهات «يوتيوب»، وخاصة أن قسم «DeepMind» التابع لـ«غوغل» كان قد أشار سابقا إلى احتمالية الاستفادة من محتوى «يوتيوب» لتدريب الذكاء الاصطناعي.
ولمواجهة تقنيات «التزييف العميق» ستحصل مقاطع الفيديو المولدة بنموذج «Veo 3» على علامات مائية خاصة، إذ تستخدم «غوغل» تقنية «SynthID» التي تدمج علامات غير مرئية في كل إطار من إطارات الفيديو، وبالتالي سيكون بالإمكان معرفة أن المقطع تم توليده بالذكاء الاصطناعي.
يتوفر النموذج الجديد ضمن تطبيق «Gemini» لمستخدمي باقات «AI Ultra» التي تكلّف اشتراكاتها 250 دولارا شهريا.