Gần đây thì cụm từ trí tuệ nhân tạo có vẻ khá nóng, đặc biệt là ChatGPT của tập đoàn OpenAI. Google cũng không cho phép mình đứng ngoài cuộc chơi khi cho ra mắt AI mới có khả năng tạo ra một bản nhạc dài từ vài phút chỉ bằng văn bản gợi ý. Thậm chí nó có thể chuyển đổi giọng huýt sáo hoặc câu ngân nga của bạn thành những âm thanh bằng nhạc cụ.
Đọc thêm:
- ChatGPT là gì mà khiến cả thế giới “khiếp sợ”, kể cả Google?
- Apple có thể sẽ ra mắt MacBook với màn hình cảm ứng
- Google Chrome bổ sung Passkeys cho phép đăng nhập không cần mật khẩu
MusicLM, mô hình AI của Google tạo ra âm nhạc dựa theo văn bản
MusicLM, một mô hình tạo ra âm nhạc có độ trung thực cao từ các mô tả văn bản chẳng hạn như ” giai điệu vĩ cầm êm dịu với ác đoạn riff guitar…” MusicLM sẽ sáng tạo một bản nhạc ở mức 24 kHz với thời lượng từ vài phút. Những mô tả của Google cho thấy MusicLM vượt trội hơn các hệ thống trước đó bởi chất lượng âm thanh và việc tuân thủ theo mô tả của người dùng.
Đi kèm với quá trình công bố, Google cũng đưa ra công khai MusicCaps – một bộ dữ liệu bao gồm 5,5 ngàn cặp văn bản và âm nhạc với các mô tả bằng văn bản đa dạng do chính con người tạo ra.
MusicLM sáng tạo âm nhạc từ những chất liệu gì?
Có những đoạn nhạc thật sự rất ấn tượng khi chỉ hơn 30s nhưng nó có thể đánh lừa chúng ta rằng đó có thể được tạo ra bởi con người. Ngoài ra nó cũng có thể tạo ra những đoạn dài hơn và phức tạp hơn, thậm chí là kết hợp giữa nhiều loại nhạc cụ và các kỹ thuật âm nhạc nếu được mô tả kỹ càng và chính xác. Trang web cho phép bạn phát âm thanh đầu vào, trong đó ai đó ngân nga hoặc huýt sáo một giai điệu, sau đó cho phép bạn nghe cách mô hình tái tạo âm thanh đó dưới dạng dẫn đầu synth điện tử, tứ tấu đàn dây, độc tấu ghi-ta, v.v.
Nó thậm chí còn có thể thể hiện sự khác biệt âm thanh của một người mới tập tành và một tay lão luyện đàn piano. Những đoạn nhạc ngắn với yêu cầu mô phỏng nhạc cụ cũng cho thấy tiềm năng phát triển của MusicLM.
MusicLM thậm chí có thể mô phỏng giọng hát của con người và mặc dù có vẻ như nó có được giai điệu và âm thanh tổng thể của giọng nói, nhưng chất lượng của chúng có thể là chưa giống.
Âm nhạc do AI tạo ra đã có lịch sử lâu đời từ hàng thập kỷ trước, có những hệ thống đã được ghi nhận trong việc sáng tác các bài hát pop, sao chép Bach tốt hơn con người có thể làm trong những năm 90, và kèm theo đó là các buổi biểu diễn trực tiếp.
Rủi ro về bản quyền khi sử dụng MusicLM
Giống như những bước đột phá khác vào loại AI này, Google đang thận trọng hơn đáng kể với MusicLM so với một số công ty cùng ngành với công nghệ tương tự. “Chúng tôi không có kế hoạch phát hành các mô hình vào thời điểm này,” bài báo kết luận, trích dẫn các rủi ro về đạo văn và khả năng chiếm đoạt hoặc xuyên tạc văn hóa.
Trong tương lai công nghệ này sẽ xuất hiện trong một trong những thử nghiệm âm nhạc thú vị của Google vào một thời điểm nào đó, nhưng hiện tại, những người duy nhất có thể sử dụng nghiên cứu này là những người khác đang xây dựng hệ thống AI âm nhạc. Google cho biết họ đang phát hành công khai một bộ dữ liệu với khoảng 5.500 cặp văn bản âm nhạc, có thể hữu ích khi đào tạo và đánh giá các AI âm nhạc khác.
Như vậy là mặc dù Google đã nói những thứ tốt đẹp và vượt trội của nó nhưng họ vẫn chưa thể đảm bảo những ảnh hưởng tiêu cực của nó nếu nó trở nên đại chúng. Vì đó có thể chúng ta sẽ tiếp tục được chứng kiến cuộc đua AI dài hơi trong thời gian tới.