Đăng nhập/ Đăng ký

Claude AI của Anthropic chơi Pokémon Red, chiến thắng trong trận chiến phòng tập trực tiếp trên Twitch

2025/02/26 12:25

Theo dõi

Mô hình AI Claude 3.7 Sonnet tham gia thí nghiệm trực tiếp với Pokémon Red

Trí tuệ nhân tạo đang chứng minh khả năng điều hướng thế giới kỹ thuật số theo những cách không ngờ tới.

Phiên bản mới nhất của Claude của Anthropic, được gọi là Claude 3.7 Sonnet, có thể chơi “Pokémon Red” chứ không chỉ nhấn các nút ngẫu nhiên.

Đó là việc chủ động xây dựng chiến lược, đưa ra quyết định và thích ứng với những thách thức theo thời gian thực.

Mô hình AI của Anthropic,phát trực tiếp trên Twitch dưới kênh “ClaudePlaysPokemon,” đã đánh bại ba Gym Leader, một thành tích mà các mô hình Claude trước đây phải rất khó khăn mới đạt được.

Thí nghiệm này cho thấy AI đang tiến bộ như thế nào, vượt ra ngoài việc thực hiện nhiệm vụ đơn giản và tiến tới các tình huống giải quyết vấn đề phức tạp hơn.

AI học cách chiến đấu, thích nghi và vượt qua chướng ngại vật

Không giống như phiên bản trước, Claude 3.5 Sonnet, không thể thoát khỏi nhà của người chơi trong "Pokémon Red", Claude 3.7 Sonnet đã cho thấy sự tiến bộ đáng chú ý.

Chỉ trong vòng vài giờ, nó đã đánh bại Brock, Nhà lãnh đạo phòng tập đầu tiên, và chỉ vài ngày sau, đã đánh bại Misty.

Tuần trước, một nhà nghiên cứu đã thử nghiệm bản xem trước của Claude 3.7 Sonnet.

Kết quả thật ấn tượng. Trong vòng vài giờ, Claude đã đánh bại Brock. Vài ngày sau, nó đã đánh bại Misty. Tiến bộ mà các mô hình cũ ít có hy vọng đạt được.

Hóa ra suy nghĩ mở rộng lại cực kỳ hiệu quả.pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI)Ngày 25 tháng 2 năm 2025

Anthropic giải thích rằng thành công này đến từ khả năng ghi chép, quan sát màn hình trò chơi và sử dụng lệnh gọi hàm để tương tác với trò chơi của mô hình.

Thay vì dựa vào các hành vi được đào tạo trước, Claude 3.7 Sonnet xử lý từng tình huống, lập kế hoạch trước và điều chỉnh khi cần thiết—mặc dù không tránh khỏi những khó khăn.

Có một lúc, Claude bị kẹt trước một bức tường đá và liên tục cố gắng di chuyển qua đó.

Phải mất một thời gian AI mới nhận ra được tuyến đường thay thế.

Một người dùng trên Twitch đã đưa ra một quan điểm hài hước về tình huống này,

“Ai sẽ thắng, một máy tính AI với hàng nghìn giờ lập trình, hay 1 bức tường đá?”

Cuối cùng, Claude đã tìm ra cách vượt qua trở ngại, chứng minh khả năng học hỏi từ sai lầm thay vì chỉ lặp lại những hành động thất bại vô thời hạn.

AI chơi trò chơi điện tử đang trở thành chuẩn mực nghiên cứu

Các mô hình AI chơi trò chơi điện tử không phải là một khái niệm mới, nhưng đây vẫn là một cách hữu ích để kiểm tra khả năng suy luận của chúng.

Vào tháng 3 năm 2024, các nhà nghiên cứu đã sử dụng ChatGPT của OpenAI để chơi game bắn súng góc nhìn thứ nhất kinh điển "Doom" và đã thành công khi đến được phòng cuối cùng của trò chơi.

Cùng thời điểm đó, Google DeepMind đã giới thiệu Scalable Instructable Multiworld Agent (SIMA), có khả năng chơi các trò chơi như "No Man's Sky", "Teardown" và "Valheim" chỉ bằng hình ảnh trên màn hình và hướng dẫn bằng ngôn ngữ tự nhiên—không cần truy cập vào mã nguồn hoặc API đặc biệt.

Không giống như tự động hóa dựa trên quy tắc đơn giản, các mô hình AI này thể hiện mức độ lý luận chung.

Trong năm qua, một số nhà nghiên cứu tại Anthropic đã dành thời gian bận tâm nghiên cứu một vấn đề kỳ lạ.

Claude có thể chơi Pokémon không?

Một chủ đề:pic.twitter.com/K8SkNXCxYJ
— Anthropic (@AnthropicAI)Ngày 25 tháng 2 năm 2025

Anthropic lưu ý rằng “Pokémon Red” là một bài kiểm tra đặc biệt hữu ích đối với Claude 3.7 Sonnet vì nó yêu cầu mô hình phải giải các câu đố và đưa ra quyết định chiến lược thay vì chỉ phản hồi các lệnh trực tiếp.

Có hai điều đã xảy ra hôm nay:
1. Claude đã được nâng cấp.
2. AGI cuối cùng đã được định nghĩa là "bất kỳ mô hình nào có thể bắt được Mewtwo".https://t.co/0uUVMfwiaq pic.twitter.com/nCFOpzizkf
— Amanda Askell (@AmandaAskell)Ngày 24 tháng 2 năm 2025

Quay trở lại với Twitch Plays Pokémon, nhưng với một người chơi AI

Với nhiều người, việc xem Claude chơi "Pokémon Red" gợi lại những ký ức về "Twitch Plays Pokémon", một thử nghiệm xã hội trực tuyến năm 2014, trong đó hàng nghìn người chơi cùng nhau điều khiển trò chơi thông qua các lệnh trò chuyện.

Bản chất hỗn loạn và hợp tác của sự kiện đó đã biến nó thành một hiện tượng văn hóa.

Đúng 11 năm trước, vào đúng giờ này, ngày 12 tháng 2 năm 2014 lúc 23:16:01 UTC, Twitch Plays Pokémon đã phát trực tiếp phiên bản Pokémon Red lần đầu tiên!

Phải mất 16 ngày 7 giờ 50 phút 40 giây để người xem xem hết phần giới thiệu cuối phim.pic.twitter.com/CK8uNUfWwf
— Bulbapedia (@Bulbapedia)Ngày 12 tháng 2 năm 2025

Bây giờ, thay vì một cộng đồng cùng làm việc, người xem sẽ theo dõi một AI đấu tranh trong cuộc phiêu lưu đơn độc.

Trải nghiệm này mang lại cảm giác khác biệt—mang tính quan sát hơn là tương tác.

Cách tiếp cận cẩn thận, từng bước của Claude trái ngược hoàn toàn với lối chơi thất thường, chạy theo đám đông của Twitch Plays Pokémon gốc.

Một khoảnh khắc đặc biệt thú vị xảy ra khi Claude, trong khi đang tìm kiếm Giáo sư Oak, đã liên tục tương tác với NPC sai mặc dù đã nói chuyện với họ nhiều lần trước đó.

Một số người xem tỏ ra mất kiên nhẫn, trong khi những người khác lại tỏ ra thông cảm hơn:

“Các bạn bình tĩnh nào. Trước khi chúng ta ra vào phòng thí nghiệm của Oak khoảng 10 lần trước khi hiểu cách tiếp tục.”

Đây không phải là lần đầu tiên AI được sử dụng cho mục đích như vậy.

Vào tháng 10 năm 2023, kỹ sư phần mềm Peter Whidden ở Seattle đã chia sẻ một video trên YouTube cho thấy cách anh ấy dạy AI học tăng cường chơi Pokémon.

CácAI đã dành hơn 50.000 giờ để tìm hiểu trò chơi , nhưng trên đường đi, nó hơi mất tập trung—đôi khi dừng lại chỉ để chiêm ngưỡng khung cảnh pixel thay vì thực sự chơi.

Mặc dù Claude 3.7 Sonnet có cách tiếp cận chậm rãi và chắc chắn, nhưng tiến trình của nó trong "Pokémon Red" lại hé lộ tương lai của AI.

Nó cho thấy cách các mô hình có thể phát triển để giải quyết những thách thức mới bằng cách suy nghĩ giải quyết vấn đề từng bước một, thay vì chỉ được đào tạo cho các nhiệm vụ cụ thể.

Artificial Intelligence

Có được sự hiểu biết rộng hơn về ngành công nghiệp tiền điện tử thông qua các báo cáo thông tin và tham gia vào các cuộc thảo luận chuyên sâu với các tác giả và độc giả cùng chí hướng khác. Chúng tôi hoan nghênh bạn tham gia vào cộng đồng Coinlive đang phát triển của chúng tôi:https://t.me/CoinliveSG

Thêm bình luận

Đăng nhậpđể lại nhận xét tuyệt vời của bạn…

0 Bình luận

Sớm nhất

Tải thêm bình luận

Cập nhật trực tiếp

10 giờ trước
Nghiên cứu 10x: Thị trường quyền chọn Bitcoin đã dự đoán đợt thoái lui này và biến động ngắn hạn có thể tiếp tục
Tăng giá
Bearish
10 giờ trước
VanEck: Đợt thoái lui của Bitcoin vào tháng 10 là sự điều chỉnh giữa chu kỳ, không phải là tín hiệu của thị trường giá xuống
Tăng giá
Bearish
10 giờ trước
Các thành viên cốt cán của Virtuals đã đăng một tin nhắn cảm ơn nhóm Base vì sự hỗ trợ của họ trong quá trình xây dựng dự án
Tăng giá
Bearish
11 giờ trước
Nhóm Limitless thông báo rằng token LMTS đã được ra mắt bí mật và kế hoạch mua lại đã được triển khai.
Tăng giá
Bearish
11 giờ trước
Kalshi vs Polymarket: Jupiter’s bet heats up prediction wars
Tăng giá
Bearish
11 giờ trước
Bitcoin’s Next Bull Phase Could Be Near As BTC-Stablecoin Ratio Plummets
Tăng giá
Bearish
11 giờ trước
Major U.S. Asset Manager Files for Active Crypto ETF
Tăng giá
Bearish
11 giờ trước
Major asset manager T. Rowe Price files for crypto ETF
Tăng giá
Bearish
12 giờ trước
Bitcoin could see a sharp drop below $100,000 by weekend: Standard Chartered
Tăng giá
Bearish
12 giờ trước
Ethereum Price Forecast: ETH Foundation wallet switch sparks $700 million profit realization
Tăng giá
Bearish

Hơn

Tin tức xu hướng

Hơn

Claude AI của Anthropic chơi Pokémon Red, chiến thắng trong trận chiến phòng tập trực tiếp trên Twitch

Mô hình AI Claude 3.7 Sonnet tham gia thí nghiệm trực tiếp với Pokémon Red

AI học cách chiến đấu, thích nghi và vượt qua chướng ngại vật

AI chơi trò chơi điện tử đang trở thành chuẩn mực nghiên cứu

Quay trở lại với Twitch Plays Pokémon, nhưng với một người chơi AI

Cập nhật trực tiếp

Tin tức xu hướng

Đèn xanh hợp pháp cho độ C: NewCo xuất hiện

Những người đồng sáng lập Bitwise đối mặt với việc bị bắt trong kế hoạch lừa đảo nhà đầu tư trị giá 100 triệu USD

Mã thông báo BRC-20 SATS có phải là lừa đảo không? Chúng tôi nghĩ điều đó có thể xảy ra.

Ca sĩ Đài Loan Chen Lingjiu có liên quan đến vụ bê bối lừa đảo tiền điện tử JPEX

Đặt cược Bitcoin của MicroStrategy: Lợi nhuận hơn 1 tỷ bảng

Ra mắt chương trình tặng thẻ Pokémon được token hóa của Courtyard

Động thái hướng tới hiệu quả của USDC: Giảm 7% phí trong các giao dịch Stablecoin

Mối đe dọa của AI: Những kẻ cực đoan khai thác các công cụ sáng tạo

Ca sĩ Đài Loan Nine Chen: "Không làm có nghĩa là không làm" giữa cáo buộc lừa đảo JPEX [Đã cập nhật]

Phim truyền hình JPEX: Những nghi phạm mới được tìm thấy và những khúc mắc pháp lý