Tin tức

Google Deepmind cho ra mắt Google Veo và Imagen 3 cho phép tạo video và hình ảnh tiên tiến nhất

20/05/2024

Vừa qua vào rạng sáng 15/5 theo giờ Hà Nội, sự kiện Google I/O đã cho chúng ta đã được chứng kiến sự ra mắt của Google Veo – mô hình tạo video mới nhất và tiên tiến nhất của Deepmind, cũng như Imagen 3 – mô hình chuyển văn bản thành hình ảnh chất lượng cao nhất của họ. Hôm nay, hãy cùng Phong Vũ tìm hiểu xem sự tuyệt vời và tiện lợi mà công cụ này mang lại nhé.

Apple đạt bước tiến lớn trong lĩnh vực AI, sẵn sàng cạnh tranh với Gemini, GPT-4?

NVIDIA giới thiệu hệ thống AI mới: Bước ngoặt ấn tượng dành cho NPC trong game

Không gì là Trung Quốc không thể: Tạo chatbot AI người đã khuất với giá vài trăm USD

Mục lục

Tổng quan về Google Veo, một công cụ AI tạo video từ Google DeepMind

Google Veo, một công cụ AI tạo video cao cấp phát triển bởi Google DeepMind được ra mắt trong Sự kiện Google I/O tổ chức vào ngày 15/5. CEO Demis Hassabis đã giới thiệu Google Veo với khả năng tạo video chất lượng cao, âm điệu và đa dạng về phong cách hình ảnh và điện ảnh. Được xem là một động thái cạnh tranh với công cụ Sora của OpenAI, Veo nổi bật với khả năng hiểu ngôn ngữ tự nhiên và sáng tạo video phản ánh chính xác trí tưởng tượng của người dùng.

Google Veo có thể hiểu ngôn ngữ tự nhiên và nắm bắt âm điệu của câu lệnh, giúp tạo ra các video phản ánh chính xác trí tưởng tượng của người dùng. Veo cũng hiểu rõ các thuật ngữ điện ảnh như “timelapse” hay “ảnh phong cảnh từ trên không”, từ đó tạo ra các cảnh quay mạch lạc, sống động với con người, động vật và đồ vật chuyển động chân thực. Dưới đây là một video mà Veo đã làm, chúng ta hãy cùng xem nhé.

Mô hình chuyển văn bản thành video của Google DeepMind Veo tạo video 60 giây

Các video minh họa khả năng của Google Veo thường kéo dài khoảng 8 giây, nhưng người dùng có thể yêu cầu kéo dài thời lượng lên đến 1 phút 10 giây và tinh chỉnh video qua các câu lệnh bổ sung. Ở điểm này, Veo đã vượt trội hơn so với Sora của OpenAI, những AI vốn chỉ có thể tạo ra video với thời lượng tối đa một phút.

Google Veo được xây dựng trên nền tảng nhiều mô hình tạo video như Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet và Lumiere, kết hợp với nhiều kỹ thuật khác để nâng cao chất lượng và độ phân giải. Google đã cải tiến kỹ thuật để mô hình học cách hiểu nội dung và mô phỏng các tính chất vật lý, mở ra nhiều tiềm năng trong nghiên cứu và phát triển AI.

Veo xây dựng trên nền tảng nhiều mô hình tạo video như Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet và Lumiere

Các công cụ AI khác mà Google giới thiệu tại Google I/O rạng sáng 15/5

Tại sự kiện, Google cũng giới thiệu Imagen 3, công cụ AI tạo hình ảnh mới có khả năng tạo ra hình ảnh chi tiết, chân thực và sống động. Imagen 3 hiểu ngôn ngữ tự nhiên, dự đoán mục đích từ các câu lệnh, và mang đến nhiều phong cách hình ảnh đa dạng.

Tạm kết

Dù Veo và Imagen 3 vẫn chưa được phát hành rộng rãi, Google cho biết một số nhà sáng tạo nội dung đã được trải nghiệm công cụ này. Các tính năng của Veo sẽ được tích hợp vào YouTube Shorts và các sản phẩm khác của Google, tạo ra trải nghiệm tương tác và sáng tạo mới cho người dùng trong tương lai. Hãy cùng trông đợi một ngày không xa, chúng ta có thể sử dụng Veo mà Imagen 3 để phục vụ công việc và đời sống nhé.

Google Deepmind cho ra mắt Google Veo và Imagen 3 cho phép tạo video và hình ảnh tiên tiến nhất

Tổng quan về Google Veo, một công cụ AI tạo video từ Google DeepMind

Các công cụ AI khác mà Google giới thiệu tại Google I/O rạng sáng 15/5

Tạm kết

PHONG VŨ CÔNG NGHỆ

GIỚI THIỆU PHONG VŨ

Kỉ nguyên AI mới bắt đầu với sự bắt tay của...