Những ngày vừa qua, đường đua Trí tuệ nhân tạo càng thêm sôi động hơn bởi có sự góp mặt của các “ông lớn” trong ngành công nghệ – điển hình như Google đã nâng cấp và ra mắt thêm loạt sản phẩm AI mới. Cùng xem qua những mẫu công nghệ này có điểm gì đặc sắc nhé!
Tại sự kiện thường niên I/O 2024, Google đã mang đến màn ra mắt ấn tượng với các sản phẩm AI mới: Veo và Imagen 3, bên cạnh đó là thông báo nâng cấp chatbot Gemini 1.5 Flash với nhiều cải tiến hỗ trợ người dùng một cách tối đa.
- Bắt kịp ChatGPT, Google Bard đã hỗ trợ tiếng Việt
- Google Deepmind cho ra mắt Google Veo và Imagen 3 cho phép tạo video và hình ảnh tiên tiến nhất
- Những tính năng AI trên Google Docs mà sinh viên và marketers phải bỏ túi ngay!
Gemini phiên bản mới cải tiến vượt trội, xử lý nhanh mọi thông tin
Đáp ứng mọi nhu cầu linh hoạt của các nhà sáng tạo nội dung: nhanh chóng, tiết kiệm chi phí và chứa được nhiều thông tin dữ liệu. Vậy nên các phiên bản Gemini 1.5 Flash, Gemini 1.5 Pro, Gemini Live,…được phát triển và mang đến nhiều tính năng tiện lợi, giúp bạn dễ dàng ứng dụng vào công việc.
Gemini 1.5 Pro và Gemini Flash cho phép triển khai mô hình ngôn ngữ mở rộng, tối ưu trên Chrome dành cho máy tính từ phiên bản 126 trở lên. Các tính năng có thể kể đến như tóm tắt các cuộc hội thoại, chú thích hình ảnh/video hoặc trích xuất dữ liệu từ những tài liệu lớn. Ngoài ra còn được tích hợp vào thanh công cụ của Google, đa năng hơn trong việc soạn thảo, dịch thuật …
Gemini Live cũng là một cập nhật mới của Google, thực hiện hành động như một “trợ lý số” giúp bạn cập nhật cũng như thông báo tin tức mới. Gemini Live tích hợp 10 giọng nói khác nhau cho bạn lựa chọn, mang đến sự tự nhiên và tinh gọn khi giao tiếp hoặc giải đáp yêu cầu của người sử dụng.
Veo – Công cụ trích xuất văn bản thành video
Để cạnh tranh với các hãng công nghệ khác, Google mang đến Veo với những tính năng hiện đại, giúp tối ưu quá trình chuyển đổi giữa văn bản sang video chất lượng cao một cách liền mạch.
Công cụ này hoàn toàn có khả năng hỗ trợ người dùng tạo ra những thước phim chuyên nghiệp theo sự sáng tạo của bạn, những mô tả chuyển động của con người, sự vật chân thật nhất. Ngoài ra bạn cũng có thể chỉnh sửa đoạn phim bằng các câu lệnh yêu cầu bổ sung.
Về phần kỹ thuật, Veo có thể tạo ra được những cảnh quay điện ảnh hơn, đòi hỏi nhiều kỹ thuật như tua nhanh thời gian, góc quay từ trên cao, chuyển động nhanh chậm,…với độ phân giải 1080p ổn định, mang đến những trải nghiệm sống động nhất.
Tuy không phải là tính năng mới trên thị trường trí tuệ nhân tạo, nhưng Veo cũng là một công cụ tạo video từ văn bản mà các nhà sáng tạo nội dung nên trải nghiệm. Trong tương lai, chắc chắn Google sẽ phát triển nhiều khía cạnh mới của Veo để đáp ứng nhu cầu sử dụng của các tín đồ công nghệ.
Imagen 3 tạo ra được hình ảnh chân thực và sắc nét
Đây là một tính năng không mới, tuy nhiên Imagen 3 vẫn mang đến sự hữu ích khi người dùng muốn chuyển đổi văn bản sang hình ảnh. Sản phẩm được tạo ra có độ phân giải cao, được đánh giá là có mức độ chi tiết đáng kinh ngạc, mô tả sống động như thật hơn các mô phỏng trước đây được tạo ra.
Phiên bản Imagen 3 chắc chắn sẽ là công cụ mang đến nhiều hình ảnh sáng tạo, dựa theo mô tả và đúng với yêu cầu của bạn.
Tổng quan về những công cụ AI mới của Google
Dù mới ra mắt nhưng các công cụ trên cũng vấp phải nhiều ý kiến trái chiều hoặc chưa được công nhận rộng rãi. Sau khi ra mắt, các tín đồ công nghệ đã đặt Veo lên bàn cân so sánh với đối thủ Sora của OpenAI được ra mắt vài tháng trước đó. Cùng một tính năng phát triển ra thước phim từ văn bản nhưng Sora có phần nổi bật hơn Veo của Google.
Tuy vậy, các tính năng trên của Google đều có những điểm nổi bật đáng để bạn quan tâm và trải nghiệm. Với sự giúp sức của công nghệ AI, công việc sáng tạo nội dung của bạn sẽ trở nên dễ dàng hơn, tối ưu khả năng của bạn trong nhiều lĩnh vực khác nhau.