Vitalik Buterin đã chia sẻ giải pháp triển khai LLM riêng tư, cục bộ của mình cho đến tháng 4 năm 2026. Mục tiêu cốt lõi là ưu tiên quyền riêng tư, bảo mật và tính tự chủ, giảm thiểu cơ hội cho các mô hình từ xa và dịch vụ bên ngoài truy cập dữ liệu cá nhân. Điều này đạt được thông qua suy luận cục bộ, lưu trữ tệp cục bộ và cách ly hộp cát để giảm thiểu rủi ro vi phạm dữ liệu, bẻ khóa mô hình và khai thác nội dung độc hại. Về phần cứng, ông đã thử nghiệm các giải pháp bao gồm máy tính xách tay với GPU NVIDIA 5090, AMD Ryzen AI Max Pro với bộ nhớ hợp nhất 128 GB và DGX Spark, sử dụng các mô hình Qwen3.5 35B và 122B để suy luận cục bộ. Máy tính xách tay 5090 đạt được khoảng 90 token/giây với mô hình 35B, giải pháp AMD đạt khoảng 51 token/giây và DGX Spark đạt khoảng 60 token/giây. Vitalik cho biết ông thích xây dựng môi trường AI cục bộ dựa trên máy tính xách tay hiệu năng cao, đồng thời sử dụng các công cụ như llama-server, llama-swap và NixOS để xây dựng quy trình làm việc tổng thể.