ChatGPT đang sử dụng Grokipedia của Elon Musk làm nguồn dữ liệu

267
QC
Banner MacBook Neo

PV Tech News – Các cuộc thử nghiệm mới đây phát hiện ChatGPT phiên bản GPT-5.2 đang trích dẫn trực tiếp dữ liệu từ Grokipedia — nền tảng do AI tạo ra của Elon Musk. Điều này đang dấy lên hồi chuông cảnh báo trong giới công nghệ về tính chính xác của thông tin.

GPT-5.2 trích dẫn Grokipedia trong các chủ đề nhạy cảm
GPT-5.2 trích dẫn Grokipedia trong các chủ đề nhạy cảm (Nguồn: Internet)

Theo The Guardian, trong loạt thử nghiệm độc lập, ChatGPT GPT-5.2 đã trích dẫn Grokipedia tổng cộng 9 lần khi trả lời hơn một chục câu hỏi khác nhau. Nội dung các câu hỏi trải rộng từ cấu trúc chính trị tại Iran, các tập đoàn kinh tế lớn của nước này, cho tới những vấn đề liên quan đến các nhân vật gắn với phủ nhận Holocaust – vốn là những chủ đề nhạy cảm và đòi hỏi độ chính xác cao.

Điểm đáng chú ý là Grokipedia không xuất hiện trong các câu trả lời cho những chủ đề phổ biến hoặc đã được kiểm chứng rộng rãi. Thay vào đó, nền tảng này được ChatGPT sử dụng làm nguồn khi người dùng đặt các câu hỏi ít phổ biến hơn hoặc mang tính chuyên sâu, khiến thông tin từ Grokipedia có thể len lỏi vào câu trả lời một cách âm thầm, khó bị người dùng phổ thông phát hiện.

Được biết, Grokipedia ra mắt vào tháng 10 với tham vọng trở thành đối thủ trực tiếp của Wikipedia. Tuy nhiên, cách vận hành của hai nền tảng này có sự khác biệt rõ rệt. Trong khi Wikipedia cho phép cộng đồng con người trực tiếp biên tập và kiểm chứng nội dung, Grokipedia không cho phép chỉnh sửa thủ công. Toàn bộ nội dung trên nền tảng này do AI tạo ra và chỉ có thể thay đổi thông qua các yêu cầu gửi ngược lại cho hệ thống.

Grokipedia được giới thiệu là một bách khoa toàn thư do AI tạo ra, với tham vọng cạnh tranh trực tiếp với Wikipedia
Grokipedia được giới thiệu là một bách khoa toàn thư do AI tạo ra, với tham vọng cạnh tranh trực tiếp với Wikipedia (Nguồn: Internet)

Chính mô hình vận hành này đã khiến Grokipedia hứng chịu nhiều chỉ trích. Nhiều nhà nghiên cứu và tổ chức truyền thông cho rằng nền tảng này có xu hướng lan truyền các quan điểm mang màu sắc chính trị cực đoan, đặc biệt trong những chủ đề nhạy cảm như hôn nhân đồng giới, cuộc bạo loạn ngày 6/1 tại Mỹ hay thiên lệch truyền thông liên quan đến các nhân vật chính trị.

Về phía ChatGPT, một điểm tích cực là hệ thống không trực tiếp trích dẫn Grokipedia khi bị yêu cầu lặp lại các thông tin sai lệch đã được công khai bác bỏ, chẳng hạn như các thuyết âm mưu về HIV/AIDS hay những luận điểm sai sự thật xoay quanh cuộc bạo loạn tại Điện Capitol. Điều này cho thấy các cơ chế kiểm duyệt của OpenAI vẫn phát huy hiệu quả đối với những chủ đề “nóng”.

OpenAI khẳng định công cụ tìm kiếm web của họ hướng tới việc thu thập đa dạng nguồn tin và có bộ lọc an toàn
OpenAI khẳng định công cụ tìm kiếm web của họ hướng tới việc thu thập đa dạng nguồn tin và có bộ lọc an toàn (Nguồn: Internet)

Tuy nhiên, mối lo ngại lớn nằm ở chỗ: khi người dùng hỏi về các vấn đề ít được chú ý hơn, ChatGPT lại trích dẫn Grokipedia và thậm chí lặp lại những khẳng định mạnh hơn cả Wikipedia, bao gồm cả các chi tiết mà The Guardian khẳng định đã được kiểm chứng là không chính xác. Theo giới chuyên gia, đây là dạng sai lệch nguy hiểm nhất, bởi thông tin sai không xuất hiện trực diện mà được “gài” khéo léo trong những câu trả lời tưởng chừng vô hại.

Không chỉ ChatGPT, nhiều người dùng cũng phản ánh rằng Anthropic và mô hình Claude của hãng này từng trích dẫn Grokipedia trong các chủ đề từ sản xuất dầu mỏ cho tới văn hóa địa phương tại châu Âu. Điều này cho thấy Grokipedia đang dần trở thành một phần của hệ sinh thái nguồn dữ liệu mà nhiều mô hình AI lớn có thể tiếp cận.

Không chỉ ChatGPT, các mô hình AI khác cũng bị ảnh hưởng
Không chỉ ChatGPT, các mô hình AI khác cũng bị ảnh hưởng (Nguồn: Internet)

Các nhà nghiên cứu gọi hiện tượng này là “LLM grooming” – tức việc các tác nhân xấu chủ động tạo ra khối lượng lớn thông tin sai lệch trên internet nhằm “nuôi” và định hướng các mô hình AI trong tương lai. Khi AI bắt đầu trích dẫn những nguồn như Grokipedia, các nguồn này lại vô tình được tăng độ tin cậy trong mắt người dùng, tạo ra một vòng lặp nguy hiểm.

Trước những lo ngại này, đại diện OpenAI cho biết công cụ tìm kiếm web của ChatGPT được thiết kế để rút trích từ nhiều nguồn công khai khác nhau, đồng thời khẳng định công ty đang áp dụng các bộ lọc nhằm giảm thiểu nguy cơ lan truyền thông tin gây hại. Trong khi đó, phía xAI – công ty sở hữu Grokipedia chỉ phản hồi ngắn gọn rằng “truyền thông chính thống đang nói dối”.

Câu chuyện ChatGPT trích dẫn Grokipedia không đơn thuần là tranh cãi giữa các công ty công nghệ hay truyền thông, mà đặt ra câu hỏi lớn hơn: khi AI ngày càng trở thành nguồn tham khảo chính của con người, ai sẽ là người kiểm soát sự thật? Hãy tiếp tục theo dõi Phong Vũ Tech News để cập nhật những diễn biến mới nhất xoay quanh trí tuệ nhân tạo và các thách thức trong tương lai.

Nguồn: theguardian

Bài viết liên quan: