Tại hội nghị dành cho nhà phát triển GTC 2025 vừa diễn ra tại San Jose, California, Nvidia đã gây chấn động thị trường công nghệ với loạt sản phẩm phần cứng và phần mềm thế hệ mới, đặc biệt là siêu chip AI Vera Rubin – kiến trúc chip tiên tiến nhất của hãng. Sự kiện năm nay diễn ra từ ngày 17 đến 21/3, với bài phát biểu chính của CEO Jensen Huang vào ngày 18/3, giới thiệu chiến lược phát triển AI mới của công ty. Nếu bạn đang quan tâm đến robot hình người này thì đừng bỏ lỡ bài viết dưới đây của Phong Vũ Tech News nhé!
- Lợi nhuận Nvidia tăng gấp đôi, dự báo tiếp tục bùng nổ
- Viettel đặt mục tiêu vào top 10 bán dẫn, chọn chiến lược khác NVIDIA
- NVIDIA hợp tác với các nhà làm chip lớn để nghiên cứu chuẩn RAM mới mang tên SOCAMM
Blackwell Ultra GB300 – Bước đệm trước khi tiến tới Vera Rubin

Dự kiến xuất hiện trên thị trường vào cuối năm 2025, Blackwell Ultra GB300 là phiên bản nâng cấp của dòng GPU Blackwell ra mắt năm 2024. Mặc dù vẫn giữ nguyên hiệu năng tính toán AI 20 petaflops, chip mới được trang bị bộ nhớ HBM3e mở rộng từ 192 GB lên 288 GB. So với mẫu H100 phát hành năm 2022, Blackwell Ultra mạnh hơn 1,5 lần về khả năng suy luận AI, đạt tốc độ xử lý 1.000 token mỗi giây, gấp 10 lần mẫu chip từ ba năm trước.
CEO Jensen Huang nhấn mạnh: “AI đã có bước tiến vượt bậc. AI lý luận và Tác nhân AI đòi hỏi hiệu suất tính toán cao hơn gấp bội. Chúng tôi thiết kế Blackwell Ultra để phục vụ điều đó. Đây là nền tảng đa năng duy nhất có thể thực hiện suy luận AI tiền đào tạo, hậu đào tạo và lý luận hiệu quả bậc nhất”.
Đánh giá cao tiềm năng của sản phẩm mới, các đối tác lớn như Cisco, Dell, HP, Lenovo và Supermicro đã nhanh chóng đặt hàng Blackwell Ultra. Nvidia cũng giới thiệu giải pháp B300 NVL16 – hệ thống nhỏ gọn hơn nhưng vẫn có khả năng suy luận nhanh hơn 11 lần, tính toán cao hơn 7 lần và bộ nhớ lớn hơn 4 lần so với thế hệ Hopper tiền nhiệm.
Vera Rubin – Cuộc cách mạng chip AI năm 2026

Mặc dù Blackwell Ultra đã là một bước tiến đáng kể, nhưng Vera Rubin mới thực sự là điểm nhấn của hội nghị GTC 2025. Được CEO Huang mô tả là kiến trúc chip AI tiếp theo của Nvidia, Vera Rubin dự kiến sẽ ra mắt vào năm 2026, với phiên bản Rubin Ultra theo sau vào năm 2027.
Vera Rubin sở hữu hiệu năng tính toán lên tới 50 petaflops, gấp 2,5 lần so với Blackwell Ultra. Điểm đột phá nằm ở thiết kế độc đáo khi mỗi bộ xử lý Rubin kết hợp hai GPU để tạo thành một chip duy nhất. Tiến thêm một bước, Rubin Ultra sẽ tích hợp bốn GPU, đạt hiệu năng kỷ lục 100 petaflops.
Theo công bố từ Nvidia, một cụm NVL576 của Rubin Ultra sẽ có hiệu năng vượt trội gấp 14 lần so với cụm Blackwell Ultra. Để đáp ứng nhu cầu làm mát cho hệ thống mạnh mẽ này, Vera Rubin NVL576 sẽ được đặt trong thiết kế giá đỡ máy chủ làm mát bằng chất lỏng mới có tên là Kyber Rack.
Đáng chú ý, Nvidia không dừng lại ở Vera Rubin mà đã lên kế hoạch cho kiến trúc tiếp theo có tên Feynman, dự kiến ra mắt vào năm 2028. Tuy nhiên, công ty chưa tiết lộ chi tiết về thông số kỹ thuật của kiến trúc này.
Máy tính cá nhân AI DGX – “Siêu máy tính để bàn”

Song song với việc phát triển các chip AI hiệu năng cao, Nvidia cũng giới thiệu dòng máy tính cá nhân AI DGX với hai phiên bản là DGX Spark và DGX Station, được mô tả là “siêu máy tính để bàn”. Sản phẩm được trang bị chip Blackwell Ultra, nhằm giúp các nhà phát triển có thể trực tiếp chạy các mô hình AI suy luận lớn ngay tại nhà thay vì phải sử dụng các hệ thống máy chủ quy mô lớn.
DGX Spark nổi bật với khả năng xử lý lên đến 1.000 nghìn tỷ phép tính mỗi giây, hỗ trợ tinh chỉnh AI và suy luận với các mô hình AI tiên tiến nhất, bao gồm mô hình ứng dụng trí tuệ nhân tạo vật lý Nvidia Cosmos Reason và mô hình nền tảng robot Nvidia GR00T N1.
Trong khi đó, DGX Station còn mạnh mẽ hơn với bộ nhớ 784 GB, chuyên dụng cho các công việc đào tạo và suy luận quy mô lớn. Nền tảng ConnectX-8 SuperNIC giúp tối ưu hóa tăng tốc khối lượng công việc tính toán AI siêu quy mô. Với hỗ trợ mạng đến 800 Gb/giây, ConnectX-8 SuperNIC cho phép kết nối nhiều DGX Station lại với nhau để tăng cường hiệu suất suy luận.
Cả hai phiên bản DGX Spark và DGX Station sẽ được sản xuất bởi các đối tác lớn như Asus, Boxx, Dell, HP, Lambda và Supermicro, dự kiến giao hàng vào cuối năm nay.
Chip mạng quang tử để kết nối “nhà máy AI”

Để đáp ứng nhu cầu kết nối hàng triệu GPU trên nhiều trung tâm dữ liệu khác nhau, Nvidia giới thiệu bộ đôi chip mạng quang tử silicon mới: Spectrum-X và Quantum-X. Trong đó, Spectrum-X giúp tăng tốc hiệu suất mạng AI lên 1,6 lần so với Ethernet truyền thống, còn Quantum-X là chip mạng 800 Gb/giây đầu cuối có hiệu suất cao nhất được thiết kế cho AI quy mô lớn đầu tiên trên thế giới.
Các mẫu chip mới này sử dụng bộ chuyển mạch Ethernet Spectrum-4 và BlueField-3 SuperNIC, mang lại hiệu suất tối ưu cho AI, máy học và xử lý ngôn ngữ tự nhiên, cũng như các ứng dụng công nghiệp đa dạng. Quantum-X dự kiến sẽ có mặt vào cuối năm nay, trong khi Spectrum-X sẽ ra mắt vào năm 2026.
Phần mềm Dynamo – Nền tảng suy luận độ trễ thấp

Bên cạnh các giải pháp phần cứng, Nvidia cũng công bố nền tảng phần mềm Dynamo – hệ thống suy luận module với độ trễ thấp, mã nguồn mở để phục vụ các mô hình AI tạo sinh trong môi trường phân tán. Điểm mạnh của Dynamo là khả năng mở rộng quy mô liền mạch cho các khối lượng công việc suy luận GPU lớn, đồng thời tối ưu hóa quản lý bộ nhớ và truyền dữ liệu.
Mục tiêu chính của Dynamo là tăng tốc quá trình suy luận, giúp các mô hình AI “suy nghĩ” để trả lời câu hỏi theo nhiều bước, thay vì chỉ đưa ra một câu trả lời đơn lẻ. Phần mềm hỗ trợ tất cả các nền tảng AI suy luận và tối ưu hóa mô hình ngôn ngữ lớn (LLM) phổ biến, bao gồm cả DeepSeek-R1 của DeepSeek hay Llama của Meta, và được phát hành miễn phí.
Isaac GR00T N1 – Nền tảng cho robot hình người

Thành tựu quan trọng nhất kết nối với chip Vera Rubin chính là Isaac GR00T N1 – mô hình được Nvidia thiết kế đặc biệt cho robot hình người, được mô tả là “nền tảng robot hình người mở đầu tiên trên thế giới”. Điểm nổi bật của GR00T N1 là hệ thống “kép” giúp robot có thể suy nghĩ nhanh và chậm, tương tự như cách thức hoạt động của trí não con người.
Cụ thể, “Hệ thống 1” là mô hình hành động suy nghĩ nhanh, phản ánh phản xạ hoặc trực giác của con người, trong khi “Hệ thống 2” là mô hình suy nghĩ chậm để đưa ra quyết định có chủ đích, có phương pháp. Sự kết hợp này giúp robot có thể phản ứng nhanh với các tình huống đơn giản đồng thời xử lý các tác vụ phức tạp đòi hỏi suy nghĩ sâu sắc.
Nền tảng cho GR00T N1 bao gồm Newton – một công cụ vật lý nguồn mở được phát triển cùng với Google DeepMind và Disney Research. Newton được thiết kế để dễ dàng khái quát hóa các tác vụ thông thường như cầm nắm, di chuyển đồ vật bằng một hoặc cả hai tay, chuyển đồ vật giữa các tay, hoặc thực hiện các tác vụ nhiều bước đòi hỏi bối cảnh dài và kết hợp các kỹ năng chung với nhau.
Các công ty hàng đầu trong lĩnh vực robot hình người như Agility Robotics, Boston Dynamics, Mentee Robotics và NEURA Robotics đã tiếp cận sớm với GR00T N1. Sản phẩm này dự kiến sẽ chính thức công bố vào cuối năm nay, mở ra một kỷ nguyên mới cho robot hình người với khả năng xử lý và suy luận nâng cao nhờ kiến trúc chip Vera Rubin.







