Google ra mắt Veo 2.0 - Trình tạo video từ AI

MrH · 17 Tháng Mười Hai 2024 09:11

Chỉ vài ngày sau khi OpenAI ra mắt Sora ra công chúng, Google đã phản hồi bằng cách tung ra mô hình video AI mới nhất và tiên tiến nhất của mình, Veo 2.0. Phiên bản mới này của Veo được trang bị một số tính năng mới rất thú vị, bao gồm độ phân giải 4K, cải thiện điều khiển camera và chất lượng tổng thể cao hơn nhiều so với phiên bản tiền nhiệm.

Nếu đây là lần đầu tiên bạn nghe về Veo, thì đây là mô hình video AI của Google có khả năng tạo ra video từ các mô tả bằng văn bản. Phiên bản đầu tiên của Veo được giới thiệu vào tháng 5 năm 2024 nhưng chưa bao giờ được phát hành công khai. Hiện tại, Google đã công bố Veo 2.0 với những cải tiến đáng kể và chức năng rộng rãi hơn.

Google đã giới thiệu ba tính năng mới trong Veo 2.0:

Cải thiện tính chân thực và độ trung thực: Tính năng này giúp tạo ra video với chất lượng hình ảnh cao hơn, mang lại cảm giác gần gũi và sống động hơn.
Khả năng chuyển động nâng cao: Tính năng này cho phép mô hình xử lý và tạo ra các chuyển động phức tạp hơn trong video, làm cho nội dung trở nên hấp dẫn hơn.
Tùy chọn điều khiển camera tốt hơn: Người dùng có thể kiểm soát nhiều khía cạnh của camera hơn, giúp tạo ra các góc quay và bố cục video linh hoạt hơn.

Để chứng minh khả năng của Veo 2.0, Google đã tiến hành các đánh giá từ con người so với các mô hình tạo video hàng đầu khác như Movie Gen của Meta, Kling v1.5, Minimax và Sora Turbo.

Các đánh giá viên đã xem 1.003 mẫu video được tạo ra bằng cách sử dụng các gợi ý từ bộ dữ liệu MovieGenBench của Meta. Các video được so sánh ở độ phân giải 720p với các độ dài khác nhau: các mẫu của Veo có độ dài 8 giây, mẫu của VideoGen có độ dài 10 giây, và các mô hình khác sản xuất các video dài 5 giây.

Nhìn vào các bảng ở trên, bạn có thể thấy rằng Veo 2.0 hoạt động tốt nhất về sự ưa thích tổng thể và khả năng tuân theo các gợi ý một cách chính xác.

Tuy nhiên, với lịch sử không mấy tốt đẹp của Google khi công bố sản phẩm, bạn cần phải xem xét những tiêu chuẩn này một cách thận trọng. Luôn quan trọng để trải nghiệm trực tiếp các trình tạo video AI này trước khi đưa ra bất kỳ kết luận nào.

Dưới đây là một thử nghiệm để so sánh của một người dùng trên X.

> Prompt: A pair of hands skillfully slicing a perfectly cooked steak on a wooden cutting board. faint steam rising from it.

So với các trình tạo video khác, Google Veo 2.0 đúng là có mức độ chính xác logic hơn hẳn. Tuy nhiên phải thực sự có nhiều video mới có thể đánh giá được chính xác độ chân thực của sản phẩm này.

Để tạo video với Veo 2.0, bạn có thể làm theo các bước sau:

Truy cập Google Labs và chọn “VideoFx” từ danh sách các công cụ AI có sẵn.

Nếu bạn là một trong những người may mắn có quyền truy cập sớm vào Veo 2.0 thông qua VideoFx, bạn sẽ thấy một hộp gợi ý ở bên trái, nơi bạn có thể mô tả video mà bạn muốn tạo ra.

image828×409 86.6 KB
Khi bạn nhấp vào nút “Tạo video”, VideoFx sẽ tạo ra bốn biến thể cùng một lúc. Bạn có thể tái tạo để có thêm nhiều biến thể khác hoặc tải video về máy tính của bạn.
Một số người dùng cũng đã quan sát thấy tính năng “Chuyển đổi văn bản thành hình ảnh thành video”, cho phép bạn tạo ra một hình ảnh bằng Imagen 3 và chuyển hình ảnh đó thành video sử dụng Veo 2.0.

image828×403 53.3 KB

Nguồn :google/ medium