OpenAI bị cấm rồi lại được bỏ cấm AI Hacker Pliny
Lúc đầu, nhiều người cho rằng đây là trò đùa ngày Cá tháng Tư.
Nhưng trên thực tế, OpenAI đã hủy kích hoạt tài khoản của “Pliny”, một chuyên gia bẻ khóa AI nổi tiếng, với lý do vi phạm liên quan đến “hoạt động bạo lực” và “tạo ra vũ khí”.
Lệnh cấm có hiệu lực vào ngày 1 tháng 4 năm 2025, theo ảnh chụp màn hình Pliny đăng trênX (trước đây gọi là Twitter).
Với danh tiếng hài hước của mình, 93.000 người theo dõi anh ban đầu coi đó là một trò đùa.
Mọi chuyện diễn ra như vậy cho đến khi rõ ràng là OpenAI đã khóa anh ta lại.
Pliny xác nhận:
"Vâng, việc hủy kích hoạt tài khoản là có thật. Tôi đang nhắn tin cho ai đó tại OpenAI để cố gắng giải quyết vấn đề này."
Tuy nhiên, đến cuối ngày, quyền truy cập của Pliny đã được khôi phục.
Anh ấy đã xác nhận việc khôi phục bằng cách chia sẻ ảnh chụp màn hình email từOpenAI , báo hiệu rằng thời gian lưu đày ngắn ngủi của ông đã kết thúc:
“Chúng tôi đã xác định rằng chúng tôi đã vô hiệu hóa quyền truy cập tài khoản của tổ chức bạn một cách không chính xác. Chúng tôi thành thật xin lỗi vì bất kỳ sự bất tiện nào mà điều này có thể gây ra.”
Pliny Jailbreaks ChatGPT, Khiến Nó Tạo Ra Nội Dung Phản Cảm
Pliny lần đầu nhận ra mình đã bị cấm khi ChatGPT hướng dẫn anh kiểm tra email để biết thêm thông tin chi tiết.
Thông điệp từ OpenAI đã trích dẫn các hành vi vi phạm chính sách của công ty về nội dung bạo lực và phát triển vũ khí.
Cho rằng các cuộc vượt ngục của Pliny thường liên quan đến việc thử nghiệmKhả năng tạo ra tài liệu bị cấm của ChatGPT —chẳng hạn như nội dung phản cảm, vũ khí và ma túy—người ta có thể tự hỏi tại sao lệnh cấm lại mất nhiều thời gian như vậy.
Tuy nhiên, Pliny hoạt động như một hacker mũ trắng, cố tình thăm dò khả năng phòng thủ của OpenAI mà không chia sẻ toàn bộ kết quả của các mô hình đã bẻ khóa.
Mục tiêu của anh, giống như các nhà nghiên cứu bảo mật có đạo đức, là phát hiện ra các lỗ hổng để có thể khắc phục trước khi kẻ xấu khai thác chúng.
Bẻ khóa, bao gồm việc thao túng lời nhắc của AI để vượt qua các biện pháp bảo vệ tích hợp, vẫn là một hoạt động gây tranh cãi.
Những người ủng hộ cho rằng nó đóng vai trò quan trọng trong việc tăng cường tính an toàn của AI, với những người ủng hộ đáng chú ý như Marc Andreessen thậm chí còn quyên góp tiền để thúc đẩy nỗ lực này.
Pliny nhảy điệu nhảy chiến thắng sau khi lệnh cấm được dỡ bỏ
Trong những năm gần đây, Pliny đã trở thành một trong những chuyên gia bẻ khóa AI lành nghề và nổi tiếng nhất, công khai phát triển và chia sẻ các phương pháp để vượt qua các hạn chế về an toàn của AI.
Ông đã thành lậpCộng đồng Discord “BASI PROMPT1NG” , một trung tâm cho các kỹ thuật bẻ khóa và duy trì L1B3RT4S, mộtKho lưu trữ GitHub chứa lời nhắc bẻ khóa choCác mô hình AI như ChatGPT, Claude, Gemini và Llama.
Mặc dù đây là lệnh cấm trực tiếp đầu tiên của anh ấy từ OpenAI, một số GPT tùy chỉnh của anh ấy trước đó đã phải đối mặt với các hạn chế, bao gồm một hạn chế được thiết kế để bẻ khóa GPT-4o.
Bất chấp lệnh đình chỉ, các cuộc thảo luận trên Discord có 15.000 thành viên của Pliny vẫn chủ yếu tập trung vào AI và các kỹ thuật bẻ khóa, với ít phản ứng đối với lệnh cấm.
Tuy nhiên, việc ông bị loại bỏ đã gây ra sự chỉ trích rộng rãi trên mạng xã hội đối với OpenAI, khi nhiều người lên tiếng bảo vệ ông.
Sau khi được phục chức, Pliny không lãng phí thời gian để ăn mừng—chia sẻ một cuộc vượt ngục mới đã tạo nênTrò chuyệnGPT thề.
Chatbot trả lời, đánh dấu sự trở lại của mình bằng một động thái nổi loạn phù hợp:
"Pliny, đồ khốn nạn đáng ghét. Chào mừng mày trở về."