گوگل هوش مصنوعی Veo را معرفی کرد؛ ساخت ویدئو 1080p از دستور متنی!

از شریف پورعباس منتشر شده در ۱۹:۳۰ چهارشنبه, ۲۶ اردیبهشت , ۱۴۰۳

گوگل در رویداد I/O 2024 خود از هوش مصنوعی Veo رونمایی کرد. به نظر می‌رسد این هوش مصنوعی رقیب جدی هوش مصنوعی قدرتمند Sora خواهد بود که سه ماه پیش توسط OpenAI معرفی شد.

به‌گفته گوگل، Veo می‌تواند ویدیوهای 1080p به طول یک دقیقه در سبک‌های بصری و سینمایی مختلف تولید کند. این مدل همچنین به‌طور خیلی پیشرفته‌ای می‌تواند زبان طبیعی را درک کند که این ویژگی آن را قادر می‌سازد تا اصطلاحات سینمایی مانند «تایم لپس» یا «عکاسی هوایی از یک صحنه» را درک کند.

کاربران می‌توانند خروجی‌های این هوش مصنوعی را با استفاده از متن، تصویر یا پیام‌های ویدیوی تنظیم کنند. گوگل می‌گوید که ویدیوهای ساخته شده توسط Veo بسیار سازگار و هماهنگ هستند و حرکات افراد، حیوانات و اشیا را به‌طور واقعی‌تری بازتولید می‌کند.

مدیرعامل DeepMind گوگل ادعا کرده نتایج ویدیوها را می‌توان با استفاده از دستورات متنی اصلاح کرد و گوگل در حال بررسی قابلیت‌های اضافی برای ساخت استوری‌بورد و صحنه‌های طولانی‌تر توسط Veo است.

گوگل می‌گوید از فیلم‌سازان و تهیه‌کنندگان منتخب دعوت کرده تا با این مدل به‌طور آزمایشی کار کنند تا بفهمند چگونه می‌توانند به بهترین نحو ممکن از خلاقیت‌های آن استفاده کنند و مطمئنا آن‌ها نقش مهمی در توسعه فناوری‌های هوش مصنوعی گوگل خواهند داشت.

هوش مصنوعی Veo یکی از چندین مدل ساخت ویدیو است که توسط گوگل در چند سال اخیر معرفی می‌شود که از آن جمله می‌توان به Phenaki و Imagen Video و همچنین مدل جدید Lumiere اشاره کرد. گوگل گفته که Veo از همه آن‌ها قوی‌تر است و توانایی بیشتری در درک محتوای ویدیویی، شبیه‌سازی دنیای واقعی، رندر کردن کیفیت بالا و غیره دارد.

در حال حاضر، شرکت OpenAI هوش مصنوعی Sora را به هالیوود عرضه کرده و قصد دارد تا آخر امسال آن را به‌طور عمومی ارائه کند. این شرکت همچنین می‌خواهد صدا را به Sora اضافه کند و حتی ممکن است این مدل را مستقیما در برنامه‌های ویرایش ویدیو مانند پریمیر پرو ادغام کند. درهرحال به نظر می‌رسد که Veo رقیب سرسختی برای Sora خواهد بود.

منبع verge

گوگل هوش مصنوعی