Google ra mắt hai công cụ AI mới cho phép tạo video từ văn bản và hình ảnh

    Google vẫn là một trong những công ty tham gia tích cực vào cuộc đua phát triển công cụ trí tuệ nhân tạo (AI) cùng với những ông lớn khác như OpenAI, Amazon hay Meta. Tiếp tục khẳng định vị thế tiên phong của mình trong lĩnh vực AI , Google mới đây đã ra mắt hai công cụ mới đầy hứa hẹn: Veo 2Whisk Animate. Đây là hai công cụ giúp người dùng có thể tạo ra video từ văn bản và hình ảnh một cách dễ dàng và ấn tượng.

    Veo 2 – Biến câu chữ thành những thước phim chân thực

    Veo 2 là phiên bản nâng cấp từ công nghệ trước đó của Google, được thiết kế với khả năng hiểu và diễn giải nội dung văn bản một cách chính xác để tạo ra video có độ phân giải cao, hình ảnh sắc nét và chuyển động tự nhiên. Điều đặc biệt ở Veo 2 là khả năng nắm bắt các yếu tố vật lý trong cảnh quay, từ cách ánh sáng chiếu lên vật thể cho tới sự chuyển động của con người hay động vật.

    Google VEO 2

    Không chỉ đơn thuần là biến câu chữ thành hình ảnh, Veo 2 còn mang đến khả năng sáng tạo không giới hạn. Người dùng chỉ cần mô tả ngắn gọn như "cảnh biển lúc hoàng hôn với sóng vỗ nhẹ và chim bay qua bầu trời", công cụ sẽ tạo ra một video ngắn mô phỏng đúng mô tả đó với các hiệu ứng chân thực đến kinh ngạc.

    Dù vậy, Veo 2 hiện tại vẫn còn một số giới hạn. Video được tạo ra chỉ có độ dài tối đa là 8 giây và tỷ lệ khung hình mặc định là 16:9. Điều này có thể không hoàn toàn phù hợp với những nền tảng như TikTok hay Instagram Reels vốn ưu tiên video theo tỷ lệ dọc.

    Whisk Animate – Khi hình ảnh tĩnh có thể chuyển động

    Khác với Veo 2, Whisk Animate không tạo video trực tiếp từ văn bản mà bắt đầu từ hình ảnh. Người dùng sẽ cung cấp một hình ảnh tĩnh (có thể là ảnh được tạo bởi AI hoặc do người dùng tải lên), sau đó mô tả chuyển động mong muốn bằng văn bản. Hệ thống sẽ xử lý và biến hình ảnh đó thành một đoạn video ngắn với chuyển động mượt mà, sống động.

    Google Whisk Animate

    Ví dụ, bạn có thể tạo một bức tranh phong cảnh hoàng hôn trên núi rồi yêu cầu Whisk Animate làm cho đám mây trôi, ánh nắng thay đổi theo thời gian, hay cây cối đung đưa trong gió. Đây là một công cụ đặc biệt hữu ích cho các nhà thiết kế đồ họa, nghệ sĩ kỹ thuật số hoặc những người làm nội dung truyền thông muốn thêm chiều sâu và sinh động cho tác phẩm của mình.

    Tương tự như Veo 2, video tạo ra từ Whisk Animate cũng giới hạn độ dài trong 8 giây. Tuy nhiên, chất lượng và sự linh hoạt trong biểu đạt chuyển động vẫn là điểm mạnh vượt trội của công cụ này.

    Sự tiện dụng song song với nguy cơ về tính xác thực

    Một trong những mối lo ngại lớn nhất về nội dung do AI tạo ra là tính xác thực và nguy cơ bị lạm dụng. Nhận thức rõ điều này, Google đã triển khai các biện pháp đảm bảo tính minh bạch và an toàn trong việc sử dụng hai công cụ mới.

    Đầu tiên, mỗi video được tạo bởi Veo 2 hoặc Whisk Animate đều được gắn dấu SynthID, một loại hình mờ kỹ thuật số được nhúng trực tiếp vào từng khung hình của video. Dấu này không làm ảnh hưởng đến chất lượng hình ảnh nhưng có thể giúp nhận diện rằng video được tạo bởi AI, hỗ trợ kiểm soát nội dung và chống lại việc giả mạo.

    Ngoài ra, quy trình kiểm duyệt nội dung được tích hợp chặt chẽ trong hệ thống để đảm bảo rằng người dùng không thể tạo ra video mang tính chất nhạy cảm, bạo lực hay thông tin sai lệch. Đây là điểm cộng lớn cho Google trong bối cảnh các nền tảng AI đang bị chỉ trích vì thiếu kiểm soát nội dung.

    Ai có thể sử dụng hai công cụ này?

    Hiện tại, Veo 2 và Whisk Animate được Google cung cấp cho người dùng Gemini Advanced – một phần của gói dịch vụ Google One AI Premium. Người dùng đăng ký gói này sẽ có quyền truy cập cả trên nền tảng web lẫn di động.

    Google đang từng bước triển khai trên phạm vi toàn cầu, mở ra cơ hội cho các nhà sáng tạo nội dung ở mọi nơi tiếp cận với những công cụ mạnh mẽ này. Mặc dù việc giới hạn trong gói dịch vụ cao cấp có thể khiến nhiều người dùng phổ thông cảm thấy khó tiếp cận, nhưng đây cũng là một chiến lược hợp lý của Google nhằm đảm bảo nguồn lực duy trì và phát triển công nghệ trong dài hạn.

    Sự ra mắt của Veo 2 và Whisk Animate là bước tiến lớn trong lĩnh vực AI tạo nội dung. Cả hai công cụ đều sở hữu những tính năng vượt trội, hướng đến việc hỗ trợ người dùng tạo ra nội dung hấp dẫn, chất lượng cao mà không đòi hỏi kỹ năng chỉnh sửa video chuyên sâu. Trong thời gian tới, nếu Google tiếp tục cải tiến và mở rộng khả năng của hai công cụ này – ví dụ như hỗ trợ video dài hơn, nhiều định dạng hơn, tích hợp với các nền tảng mạng xã hội – thì chắc chắn Veo 2 và Whisk Animate sẽ trở thành công cụ không thể thiếu trong bộ công cụ sáng tạo của hàng triệu người dùng trên toàn thế giới.