
گوگل هوش مصنوعی Veo را معرفی کرد؛ ساخت ویدئو 1080p از دستور متنی!
گوگل در رویداد I/O 2024 خود از هوش مصنوعی Veo رونمایی کرد. به نظر میرسد این هوش مصنوعی رقیب جدی هوش مصنوعی قدرتمند Sora خواهد بود که سه ماه پیش توسط OpenAI معرفی شد.
بهگفته گوگل، Veo میتواند ویدیوهای 1080p به طول یک دقیقه در سبکهای بصری و سینمایی مختلف تولید کند. این مدل همچنین بهطور خیلی پیشرفتهای میتواند زبان طبیعی را درک کند که این ویژگی آن را قادر میسازد تا اصطلاحات سینمایی مانند «تایم لپس» یا «عکاسی هوایی از یک صحنه» را درک کند.
کاربران میتوانند خروجیهای این هوش مصنوعی را با استفاده از متن، تصویر یا پیامهای ویدیوی تنظیم کنند. گوگل میگوید که ویدیوهای ساخته شده توسط Veo بسیار سازگار و هماهنگ هستند و حرکات افراد، حیوانات و اشیا را بهطور واقعیتری بازتولید میکند.
مدیرعامل DeepMind گوگل ادعا کرده نتایج ویدیوها را میتوان با استفاده از دستورات متنی اصلاح کرد و گوگل در حال بررسی قابلیتهای اضافی برای ساخت استوریبورد و صحنههای طولانیتر توسط Veo است.
گوگل میگوید از فیلمسازان و تهیهکنندگان منتخب دعوت کرده تا با این مدل بهطور آزمایشی کار کنند تا بفهمند چگونه میتوانند به بهترین نحو ممکن از خلاقیتهای آن استفاده کنند و مطمئنا آنها نقش مهمی در توسعه فناوریهای هوش مصنوعی گوگل خواهند داشت.
هوش مصنوعی Veo یکی از چندین مدل ساخت ویدیو است که توسط گوگل در چند سال اخیر معرفی میشود که از آن جمله میتوان به Phenaki و Imagen Video و همچنین مدل جدید Lumiere اشاره کرد. گوگل گفته که Veo از همه آنها قویتر است و توانایی بیشتری در درک محتوای ویدیویی، شبیهسازی دنیای واقعی، رندر کردن کیفیت بالا و غیره دارد.
در حال حاضر، شرکت OpenAI هوش مصنوعی Sora را به هالیوود عرضه کرده و قصد دارد تا آخر امسال آن را بهطور عمومی ارائه کند. این شرکت همچنین میخواهد صدا را به Sora اضافه کند و حتی ممکن است این مدل را مستقیما در برنامههای ویرایش ویدیو مانند پریمیر پرو ادغام کند. درهرحال به نظر میرسد که Veo رقیب سرسختی برای Sora خواهد بود.