Thang điểm 1 đến 5 là cách OpenAI sẽ xác định mức độ mạnh mẽ của hệ thống AI

12/07/2024

Trong sự biến động của thế giới công nghệ, OpenAI lại một lần nữa khẳng định vị thế tiên phong khi công bố hệ thống đánh giá đột phá dành cho các mô hình ngôn ngữ lớn (LLMs) – bước đệm quan trọng trên con đường chinh phục trí tuệ nhân tạo tổng quát (AGI). Hệ thống này vận hành theo thang điểm từ 1 đến 5, mở ra cánh cửa dẫn đến bức tranh toàn cảnh về tương lai của AI một cách đầy hứa hẹn và tiềm năng.

OpenAI vén màn thang đo “trí tuệ” mới

OpenAI, tổ chức nghiên cứu tiên phong về trí tuệ nhân tạo (AI), đã công bố hệ thống thang điểm mới để đánh giá tiến độ của các mô hình ngôn ngữ lớn (LLMs) từ 1 đến 5 như sau:

Cấp độ 1: Khả năng thực hiện các nhiệm vụ cơ bản. Ở cấp độ này, AI có thể thực hiện các tác vụ đơn giản như trả lời câu hỏi, dịch ngôn ngữ, tóm tắt văn bản.
Cấp độ 2: Giải quyết vấn đề tương đương tiến sĩ. AI có thể giải quyết các vấn đề phức tạp đòi hỏi kiến thức chuyên môn, logic và lập luận.
Cấp độ 3: Tự động thực hiện các tác vụ thay thế con người. Ở Cấp độ này, AI có thể tự động hóa các quy trình, hoàn thành công việc mà con người thường làm, chẳng hạn như viết báo cáo, phân tích dữ liệu…
Cấp độ 4: Sáng tạo nghệ thuật, sản phẩm mới. Với cấp độ này, AI có khả năng sáng tạo ra những tác phẩm nghệ thuật, âm nhạc, văn học, hay thậm chí là phát minh khoa học mới.
Cấp độ 5: Thay thế toàn bộ một tổ chức con người. Đây là cấp độ cao nhất, khi AI có thể thực hiện bất kỳ công việc nào mà con người có thể làm, thậm chí tốt hơn. AGI ở cấp độ 5 có thể dẫn đến những thay đổi to lớn trong xã hội và nền kinh tế.

he thong cham diem cua openai 2 — OpenAI công bố hệ thống đánh giá đột phá dành cho các mô hình ngôn ngữ lớn (LLMs).

Theo Bloomberg, các chatbot hiện tại như ChatGPT chỉ mới đạt cấp độ 1. OpenAI tự tin đang tiến gần đến cấp 2, với khả năng có thể giải quyết các vấn đề cơ bản một cách mạnh mẽ như một tiến sĩ. Trước đây, OpenAI từng định nghĩa AGI chính là hệ thống tự động hóa cao, vượt trội hơn hẳn con người trong hầu hết các công việc mang lại giá trị kinh tế.

thang điểm của OpenAI — ChatGPT chỉ mới đạt cấp độ 1 của thang đánh giá từ OpenAI.

Tuy nhiên, AGI vẫn là mục tiêu xa vời. Nó đòi hỏi nguồn lực tính toán dồi dào và khổng lồ cũng thời gian nghiên cứu rất dài. Giới chuyên gia, kể cả OpenAI, vẫn chưa thể dự đoán chính xác ngày đạt được AGI. Tháng 10/2023, CEO OpenAI – Sam Altman đã cho biết chúng ta vẫn phải còn “khoảng chừng 5 năm nữa” mới chạm tới cột mốc này.

Dù vẫn đang phát triển, bên cạnh những tranh cãi, hệ thống đánh giá này cũng đánh dấu sự hợp tác quan trọng giữa OpenAI và Phòng thí nghiệm Quốc gia Los Alamos. Nó được ra mắt một ngày sau cộng tác với mục tiêu là khám phá tiềm năng vô hạn của những mô hình AI tiên tiến trong việc hỗ trợ an toàn nghiên cứu khoa học sinh học. Quản lý chương trình tại Los Alamos chia sẻ với The Verge rằng, dự án này còn nhằm thử nghiệm khả năng của GPT-4o, đồng thời thiết lập chuẩn an toàn cùng những yếu tố khác từ chính phủ Mỹ.

Việc OpenAI không cung cấp những thông tin chi tiết về cách thức để phân loại AI theo thang điểm (và từ chối bình luận) đang dấy lên lo ngại. Đặc biệt là sau khi nhóm nghiên cứu an toàn OpenAI tan rã vào tháng 5, sau khi người đứng đầu – đồng sáng lập Ilya Sutskever rời công ty. Jan Leike, nhà nghiên cứu chủ chốt khác cũng từ chức ngay sau đó vì cho rằng văn hóa cũng như quy trình an toàn đã của OpenAI đã bị đặt sau những sản phẩm hào nhoáng ở công ty.

he thong cham diem cua openai 3 — Thang điểm đánh giá đã đánh dấu sự hợp tác quan trọng giữa OpenAI và Phòng thí nghiệm Quốc gia Los Alamos.

OpenAI đã phủ nhận điều này, dù vậy, nhiều người vẫn lo ngại về các hệ lụy tiềm ẩn xảy ra nếu như OpenAI thực sự đạt được AGI. Sự bất đồng quan điểm giữa CTO Mira Murati, người cho rằng những mô hình ở phòng thí nghiệm không có gì tốt hơn nhiều so với điều gì công chúng đã tìm hiểu và CEO Sam Altman khi tin rằng những mô hình AI hiện tại đã có các bước tiến vượt bậc lại càng dấy lên hoang mang, xôn xao dư luận.

Bất chấp những tranh cãi, hệ thống đánh giá mới của OpenAI vẫn được nhiều người kỳ vọng rằng sẽ mang đến thước đo minh bạch và rõ ràng hơn cho sự phát triển của AI. Thay vì chỉ dựa vào các tuyên bố mơ hồ, giờ đây, mọi người có thể tự đánh giá được tiến độ phát triển của AI dựa trên các tiêu chí cụ thể.

Trong cuộc họp nội bộ thứ Năm vừa qua, các nhà lãnh đạo OpenAI cũng đã trình bày một dự án về nghiên cứu sử dụng thực tiễn mô hình AI GPT-4. Bloomberg cho biết, dự án này thể hiện một số kỹ năng mới từ AI với khả năng lập luận tương tự với con người. Điều đó cũng cho thấy được tiềm năng to lớn mà AI có thể mang lại trong tương lai với những thách thức về an toàn và đạo đức mới nảy sinh.

Thang điểm 1 đến 5 là cách OpenAI sẽ xác định mức độ mạnh mẽ của hệ thống AI

OpenAI vén màn thang đo “trí tuệ” mới

PHONG VŨ - CÔNG NGHỆ

GIỚI THIỆU PHONG VŨ

MỌI NGƯỜI CŨNG TÌM KIẾM

xAI ra mắt Grok 4.1 và 4.1 Thinking miễn phí, tăng...