Trong những tuần gần đây, cơn sốt Clawdbot đã càn quét cộng đồng nhà phát triển X. Từ những bản cập nhật GitHub được đăng lúc 2 giờ sáng đến những ảnh chụp màn hình khoe khoang "cuối cùng cũng chạy được rồi!" Vào đêm khuya, dự án mã nguồn mở này với biểu tượng cảm xúc hình tôm hùm đang ngày càng trở nên nổi tiếng.

(Nguồn: Clawbot)
Một số người đã mua một hoặc thậm chí nhiều máy Mac Mini chỉ với mục đích này, để chúng hoạt động cả ngày lẫn đêm tại nhà của họ. Những người khác chia sẻ cách họ sử dụng Telegram trên các kênh Discord.
Việc điều khiển máy tính từ xa để triển khai mã đã dẫn đến các cuộc thảo luận giữa các luật sư về tác động tiềm tàng của nó đối với nghề luật. Blogger công nghệ Federico Viticci thậm chí đã ghi lại chi tiết trải nghiệm của mình trên MacStories. Anh ấy đã sử dụng Clawbot để tiêu thụ 180 triệu Token API Anthropic trong một tuần, và kết luận: "Sau khi sử dụng siêu năng lực này, tôi không bao giờ có thể quay lại cách cũ nữa." (Nguồn: X) Vậy chính xác Clawdbot là gì? Tại sao nó lại tạo ra nhiều sự phấn khích như vậy trong thế giới công nghệ? Nói chính xác hơn, Clawdbot không phải là chatbot, mà là Cổng tác nhân AI. Không giống như các công cụ như ChatGPT hoặc Claude yêu cầu bạn mở một trang web, nhập câu hỏi và chờ phản hồi, logic thiết kế của Clawdbot là: đưa ra một lệnh thông qua một ứng dụng nhắn tin thông dụng (hiện hỗ trợ Telegram, WhatsApp, iMessage hoặc Discord, v.v.), và nó sẽ gọi một mô hình ngôn ngữ lớn chạy ngầm (như Claude hoặc Gemini) để dịch yêu cầu của bạn thành một tập lệnh shell cục bộ và thực thi nó trên máy tính của bạn.

Image | Gửi hướng dẫn cho Clawdbot bằng iMessage (Nguồn: Federico Viticci)
Nói cách khác, nó không bảo bạn phải làm gì, mà trực tiếp thực hiện nhiệm vụ thay bạn.
Nói cách khác, nó không bảo bạn phải làm gì, mà trực tiếp thực hiện nhiệm vụ thay bạn.

Image | Peter Steinberger (Nguồn: X)
Vào cuối năm 2025, Steinberger quyết định công khai mã nguồn trợ lý AI cá nhân "Clawdis" của mình và đổi tên dự án thành Clawdbot.
Chỉ trong vài tuần, số lượng sao trên GitHub đã vượt quá 23.000, và cộng đồng Discord đã tăng từ con số 0 lên hơn 5.000 thành viên, với một hệ sinh thái plugin kỹ năng mới nổi có tên ClawdHub đang hình thành. Các thành viên cộng đồng đã đóng góp nhiều plugin (kỹ năng) khác nhau, từ chuyển đổi tin nhắn thoại WhatsApp thành văn bản đến triển khai trang web tự động.

(Nguồn: GitHub)
Mọi thứ dường như hoàn hảo, nhưng Clawdbot vẫn còn một vấn đề không thể tránh khỏi: chi phí. Bản thân Clawdbot là mã nguồn mở và miễn phí, nhưng nó dựa vào API Mô hình Ngôn ngữ Lớn để hoạt động, và các cuộc gọi API này được tính phí bằng token. Federico Viticci, người được đề cập trước đó, đã tiêu thụ 180 triệu token trong một tuần. Theo bảng giá của Anthropic, token đầu vào có giá khoảng 3 đô la cho mỗi triệu, và token đầu ra có giá khoảng 15 đô la cho mỗi triệu, có nghĩa là hóa đơn của anh ta có thể lên tới hàng trăm hoặc thậm chí hàng nghìn đô la. Trên Reddit, một số người dùng phàn nàn rằng "việc sử dụng token quá điên rồ; nó có thể sử dụng hết giới hạn năm giờ của gói Claude Pro trị giá 200 đô la chỉ trong một giờ." Tài liệu chính thức khuyến nghị ngân sách từ 10-30 đô la mỗi tháng cho người dùng ít sử dụng, 30-70 đô la cho người dùng trung bình và 70-150 đô la hoặc hơn cho người dùng sử dụng nhiều. Đây là một khoản chi phí đáng kể đối với những người dùng muốn Clawdbot chạy 24/7 và xử lý các tác vụ phức tạp. Một vấn đề sâu xa hơn là giới hạn bộ nhớ. Mặc dù Clawdbot lưu trữ tất cả các cuộc hội thoại và thông tin đã học trong một tệp cục bộ có tên MEMORY.md, về mặt lý thuyết đảm bảo nó "không bao giờ quên", nhưng tệp này ngày càng trở nên phình to theo thời gian. Khi lượng dữ liệu mở rộng lên đến hàng nghìn hoặc thậm chí hàng chục nghìn dòng, nó có thể dẫn đến một hậu quả chưa được thảo luận đầy đủ: sự suy giảm ngữ cảnh. Khi AI cần truy xuất nội dung liên quan từ lượng lớn thông tin lịch sử, tốc độ phản hồi có thể chậm lại, độ chính xác giảm xuống, và thậm chí có thể xảy ra nhầm lẫn hoặc lỗi trong việc truy xuất. Mặc dù công nghệ RAG có thể giảm thiểu vấn đề này ở một mức độ nào đó, nhưng liệu hệ thống này có còn hiệu quả sau khi người dùng tích lũy dữ liệu sử dụng trong vài tháng hoặc thậm chí một năm hay không vẫn cần được kiểm chứng. Hơn nữa, mặc dù nhiều bài viết tuyên bố rằng "việc cài đặt cơ bản có thể hoàn thành trong 20-30 phút", nhưng ngưỡng thực tế đối với người dùng thông thường cao hơn tưởng tượng. Bạn sẽ cần cài đặt Node.js 22+, cấu hình môi trường Nix, lấy và thiết lập chính xác khóa API Anthropic hoặc OpenAI, quản lý thông tin đăng nhập trong macOS Keychain, hiểu cách truy cập Gateway một cách an toàn và cấp quyền thực thi tập lệnh shell cho ứng dụng của bạn. Điều này có thể không khó đối với các nhà phát triển, nhưng đối với người dùng thông thường, nó có thể được coi là một khoảng cách kỹ thuật đáng kể. Các ví dụ tự động hóa xuất sắc, chẳng hạn như giám sát thời gian thực khối lượng giao dịch bất thường trên thị trường quyền chọn, tự động đăng bài lên năm nền tảng mạng xã hội và tối ưu hóa tiêu đề, cũng như xây dựng một trang web hoàn chỉnh và di chuyển dữ liệu, đều yêu cầu hàng giờ hoặc thậm chí nhiều ngày phát triển tùy chỉnh. Một điểm được nhấn mạnh nhiều lần trong tài liệu là mặc dù các chức năng cơ bản của Clawdbot (quản lý tệp, nghiên cứu đơn giản và tra cứu lịch trình) thực sự có thể sử dụng ngay lập tức, nhưng các kỹ năng nâng cao hơn yêu cầu xây dựng các kỹ năng tùy chỉnh, tích hợp API của bên thứ ba và thử nghiệm cũng như gỡ lỗi nhiều lần. Một mối lo ngại khác là rủi ro bảo mật liên quan đến "bản địa hóa". Việc cấp cho AI đặc quyền cao nhất để thực thi các lệnh thiết bị đầu cuối có nghĩa là nó có thể đọc tệp của bạn, cài đặt phần mềm, sửa đổi cấu hình hệ thống và truy cập cookie và mật khẩu được lưu trong trình duyệt của bạn. Tất cả những điều này là cần thiết để Clawdbot hoạt động, nhưng nó cũng tạo ra một bề mặt tấn công khổng lồ. Một cảnh báo bảo mật được lưu hành rộng rãi trên X chỉ ra rủi ro của "tấn công chèn lệnh": Giả sử bạn yêu cầu Clawdbot tóm tắt một tệp PDF và tệp này chứa một đoạn văn bản độc hại. Vì các mô hình ngôn ngữ lớn không thể phân biệt một cách đáng tin cậy giữa "nội dung cần phân tích" và "lệnh cần thực thi", nên các lệnh độc hại này có khả năng bị thực thi. Chính nhà phát triển Steinberger cũng thừa nhận trong tài liệu bảo mật của mình: "Chạy các tác nhân thông minh rất rủi ro; vui lòng tăng cường cấu hình của bạn." Vậy, Clawdbot có đáng để thử không? Câu trả lời phụ thuộc vào kỳ vọng của bạn. Nếu bạn đang tìm kiếm một trợ lý giọng nói như Siri hoạt động ngay lập tức mà không cần cấu hình, thì Clawdbot không dành cho bạn. Nếu bạn chỉ muốn thỉnh thoảng hỏi AI các câu hỏi, ChatGPT hoặc phiên bản web của Claude có thể đủ dùng. Nhưng nếu bạn là nhà phát triển, nhà nghiên cứu, người tạo nội dung hoặc chuyên gia xử lý nhiều tác vụ lặp đi lặp lại và sẵn sàng dành vài giờ để học cách cấu hình và dần dần xây dựng quy trình làm việc tự động của riêng mình, thì khả năng của nó thực sự rất thú vị: nó thực sự có thể trở thành một trợ lý kỹ thuật số cá nhân hóa, cục bộ, ghi nhớ sở thích và thói quen của bạn, hoạt động 24/7.