Bạn đã bao giờ tranh luận với một bot của OpenAI chưa? Nếu có, bạn có thấy nó đặc biệt thuyết phục hoặc thu hút không? Nếu câu trả lời là có, thì đằng sau đó có một lý do chính đáng. OpenAI đã tiết lộ rằng, để huấn luyện một số mô hình AI mạnh mẽ nhất thế giới, họ đã sử dụng một subreddit chuyên biệt dành riêng cho việc tranh luận và để thuật toán tự học hỏi.
Khả năng lập luận và thuyết phục là một trong những kỹ năng cốt lõi mà các mô hình trí tuệ nhân tạo của OpenAI đang được phát triển mạnh mẽ. Việc khai thác nguồn dữ liệu tự nhiên từ các cuộc đối thoại thực tế đã mang lại hiệu quả đáng kinh ngạc trong việc nâng cao tư duy logic và khả năng phản biện của AI.
Giao diện chính ChatGPT hiển thị trên màn hình máy tính, minh họa khả năng tương tác của AI của OpenAI.
OpenAI Tận Dụng “Change My View” để Nâng Cao Khả Năng Lập Luận của AI
Theo báo cáo từ TechCrunch, OpenAI gần đây đã công bố mô hình o3-mini hoàn toàn mới của mình. Trong thông báo này, OpenAI đã tiết lộ phương pháp huấn luyện khả năng lập luận của AI: họ gửi mô hình của mình đến subreddit /r/changemyview
để thu thập càng nhiều thông tin càng tốt.
/r/changemyview
là một subreddit độc đáo dành riêng cho các cuộc tranh luận và lập luận, nhưng với một điểm khác biệt. Bất kỳ ai cũng có thể đăng một chủ đề để tranh luận, nhưng điều kiện là họ phải sẵn sàng đón nhận các lập luận khác. Người đăng bài gốc được phép bảo vệ và tranh luận lại trong phần bình luận, nhưng quy tắc chính là người khởi xướng cuộc tranh luận phải mở lòng với việc quan điểm của họ bị phân tích một cách có tính xây dựng. Chính vì thế mới có tên gọi “thay đổi quan điểm của tôi”.
Màn hình laptop hiển thị ứng dụng ChatGPT đang hoạt động trên hệ điều hành Windows 11, minh họa quá trình huấn luyện AI của OpenAI.
Hóa ra, nguồn dữ liệu này là một “mỏ vàng” đối với OpenAI. Sau khi cho phép AI tự do duyệt các cuộc tranh luận, OpenAI sẽ cung cấp cho mô hình một chủ đề ví dụ và yêu cầu nó tạo ra các lập luận có khả năng khiến người đăng bài gốc thay đổi quan điểm. Các phản hồi này không được đăng công khai mà thay vào đó, chúng được hiển thị cho những người thật để đánh giá độ tin cậy của từng lập luận. Những phản hồi tốt sau đó được sử dụng để tinh chỉnh ChatGPT sâu hơn nữa.
Vì vậy, nếu bạn đã từng tranh luận trên /r/changemyview
, có khả năng rất cao là một mô hình AI đã sử dụng các luận điểm của bạn cho các lập luận của riêng nó. Điều này cho thấy tầm quan trọng của các tương tác thực tế trong việc định hình và phát triển trí tuệ nhân tạo tiên tiến.
Tóm lại, việc OpenAI sử dụng subreddit “Change My View” là một chiến lược độc đáo để huấn luyện và tinh chỉnh khả năng lập luận, thuyết phục của các mô hình AI. Những cuộc tranh luận sôi nổi và mang tính xây dựng trên nền tảng này đã cung cấp nguồn dữ liệu phong phú, giúp AI học hỏi cách xây dựng lập luận logic và đáng tin cậy. Đây là một bước tiến quan trọng trong hành trình phát triển trí tuệ nhân tạo, cho thấy rằng ngay cả những tương tác trực tuyến hàng ngày cũng có thể góp phần vào việc định hình tương lai công nghệ.
Bạn nghĩ sao về cách huấn luyện AI này? Hãy chia sẻ ý kiến của bạn ở phần bình luận bên dưới!