Đăng nhập/ Đăng ký

Nâng cao quy trình làm việc của bạn: Các mô hình AI Claude mới của Anthropic đang đưa khả năng kiểm soát máy tính để bàn lên một tầm cao mới bằng cách thực hiện các tác vụ cho bạn

2024/10/23 15:38

Theo dõi

Anthropic ra mắt Claude 3.5 Sonnet và Haiku: Một bước tiến trong khả năng của AI

Anthropic vừa ra mắt các mô hình AI mới nhất, Claude 3.5 Sonnet và Claude 3.5 Haiku, tự hào có những cải tiến đáng kể so với các phiên bản trước.

Mô hình Claude 3.5 Sonnet, được cập nhật chỉ bốn tháng sau lần phát hành đầu tiên, hiện còn vượt trội hơn nữa về khả năng lập trình, một lĩnh vực mà nó đã được coi là tiên phong.

Trong khi đó, Claude 3.5 Haiku hứa hẹn sẽ mang lại hiệu suất ngang bằng với mẫu máy tiên tiến nhất trước đây là Claude 3 Opus, trong khi vẫn tiết kiệm chi phí và hiệu quả.

Có gì mới trong Claude 3.5 Sonnet?

Mô hình Claude 3.5 Sonnet giới thiệu một tính năng cải tiến: Sử dụng máy tính.

Điều này cho phép mô hình thực hiện các tác vụ thường dành riêng cho con người bằng cách tương tác với môi trường máy tính để bàn.

Bằng cách tận dụng khả năng duyệt web, Claude 3.5 Sonnet hiện có thể thực hiện các lệnh ở cấp độ máy tính để bàn.

Điều này có nghĩa là nó có thể điều khiển các ứng dụng phần mềm và sử dụng các trang web như con người.

Theo Anthropic,

“Phản hồi ban đầu của khách hàng cho thấy Claude 3.5 Sonnet nâng cấp là bước tiến đáng kể trong mã hóa hỗ trợ AI.”

Mặc dù những lợi ích là rõ ràng, nhưng vẫn còn lo ngại về tính tự chủ của AI.

Anthropic đảm bảo với người dùng rằng họ sẽ vẫn nắm quyền kiểm soát.

Thông qua lời nhắc cụ thể, người dùng có thể hướng dẫn Claude thực hiện hành động, chuyển thành lệnh máy tính để thực hiện nhiệm vụ.

Đáng chú ý, hiệu suất của Claude trên các chuẩn mực của ngành đã có sự cải thiện đáng kể, đạt 49% trên bảng xếp hạng SWE-bench Verified, tăng từ mức 33,4%.

Kết quả này đưa Claude 3.5 Sonnet lên vị trí cao hơn các mô hình hiện có khác, bao gồm cả các sản phẩm mới nhất của OpenAI.

So sánh Claude 3.5 Haiku như thế nào?

Mẫu Claude 3.5 Haiku sắp ra mắt dự kiến sẽ sớm ra mắt và hướng tới mục tiêu sánh ngang với mẫu tiền nhiệm Claude 3 Opus, đồng thời vẫn giữ nguyên tốc độ và chi phí như mẫu Haiku ban đầu.

Mô hình này nổi bật vì độ trễ thấp và khả năng tuân theo hướng dẫn được cải thiện.

Anthropic mô tả nó đặc biệt phù hợp với các sản phẩm và nhiệm vụ hướng đến người dùng, đòi hỏi tương tác nhanh với các tập dữ liệu lớn, chẳng hạn như phân tích lịch sử mua hàng hoặc hồ sơ hàng tồn kho.

Với hiệu suất vượt trội, Claude 3.5 Haiku được thiết kế để có hiệu suất cao, tự hào có những cải tiến trên mọi kỹ năng so với phiên bản trước.

Ví dụ, sản phẩm đạt được số điểm 40,6% trên bảng xếp hạng SWE-bench Verified, vượt qua nhiều mẫu sản phẩm công khai, bao gồm cả Claude 3.5 Sonnet nguyên bản.

Việc sử dụng máy tính có ý nghĩa gì đối với nhà phát triển?

Tính năng Sử dụng máy tính đánh dấu thời điểm quan trọng cho tương tác AI.

Claude 3.5 Sonnet hiện có thể "xem" giao diện máy tính thông qua ảnh chụp màn hình, cho phép điều hướng và tương tác trực tiếp với giao diện người dùng.

Các nhà phát triển có thể hướng dẫn Claude tự động hóa các tác vụ lặp đi lặp lại, cho phép quy trình làm việc hiệu quả hơn.

Anthropic chia sẻ: "Chúng tôi rất ngạc nhiên về tốc độ khái quát hóa của Claude từ khóa đào tạo sử dụng máy tính mà chúng tôi cung cấp", đồng thời nhấn mạnh khả năng chuyển đổi hướng dẫn của người dùng thành một loạt hành động hợp lý của mô hình.

Anthropic vừa công bố Sử dụng máy tính

Nó cho phép Claude điều khiển màn hình máy tính của bạn dựa trên lời nhắc và thực hiện hành động thay mặt bạn

Các trường hợp sử dụng trong mã hóa tác nhân với gỡ lỗi tự động, hỗ trợ khách hàng và giáo dục sẽ trở nên KHỦNG KHIẾPpic.twitter.com/75WUDjjuGW
— Rowan Cheung (@rowancheung)Ngày 22 tháng 10 năm 2024

Bất chấp những tiến bộ này, Anthropic thừa nhận rằng công nghệ này vẫn còn đang trong giai đoạn thử nghiệm và chưa hoàn hảo.

Người dùng nên thận trọng vì Claude có thể gặp khó khăn khi thực hiện các tác vụ cơ bản như cuộn và phóng to.

Bằng chứng giai thoại từ nhóm phát triển minh họa cho những điểm kỳ quặc của mô hình; ví dụ, có lần nó nhấp để dừng một bản ghi màn hình dài, dẫn đến mất cảnh quay.

Biện pháp an toàn và cân nhắc về mặt đạo đức

Việc giới thiệu những khả năng mạnh mẽ như vậy cũng đặt ra câu hỏi về khả năng sử dụng sai mục đích.

Anthropic đã phát triển các công cụ phân loại và bảo vệ mới để phát hiện việc sử dụng tính năng Sử dụng máy tính có hại.

Công ty vẫn cảnh giác về những tác động về mặt đạo đức của công nghệ này, lưu ý rằng nó có khả năng bị khai thác để phát tán thư rác, thông tin sai lệch hoặc các hoạt động gian lận.

Đây là một tuyên bố từ chối trách nhiệm rất tệ. Tôi thực sự thích Anthropic và Claude, nhưng tôi cảm thấy chúng ta nên bắt đầu tự hỏi liệu họ có còn là phòng thí nghiệm AI coi trọng sự an toàn không.ảnh.twitter.com/l8VMI8uM9M
— Sasha Aickin (@xander76)Ngày 22 tháng 10 năm 2024

Khi Claude 3.5 Sonnet có sẵn cho người dùng, sự mong đợi xung quanh việc ra mắt Claude 3.5 Haiku càng làm tăng thêm sự phấn khích về ý nghĩa của những tiến bộ này đối với mã hóa hỗ trợ AI và năng suất nói chung.

Artificial Intelligence

Anthropic

Có được sự hiểu biết rộng hơn về ngành công nghiệp tiền điện tử thông qua các báo cáo thông tin và tham gia vào các cuộc thảo luận chuyên sâu với các tác giả và độc giả cùng chí hướng khác. Chúng tôi hoan nghênh bạn tham gia vào cộng đồng Coinlive đang phát triển của chúng tôi:https://t.me/CoinliveSG

Thêm bình luận

Đăng nhậpđể lại nhận xét tuyệt vời của bạn…

0 Bình luận

Sớm nhất

Tải thêm bình luận

Cập nhật trực tiếp

Hôm qua
سهم اوبر في السوق الأمريكي يعود الي مستوي الدعم عند سعر 84.97 دولار أمريكي
Tăng giá
Bearish
Hôm qua
Norway’s central bank says CBDC ‘not warranted,’ cites strong payment system
Tăng giá
Bearish
Hôm qua
Strive Asset Management Launches $500 Million Stock Sale to Buy More Bitcoin
Tăng giá
Bearish
Hôm qua
BNP Paribas Profits from Shorting U.S. Treasury Bonds Following Fed Rate Cut
Tăng giá
Bearish
Hôm qua
Pump.fun leads Solana protocols in PUMP repurchases
Tăng giá
Bearish
Hôm qua
سهم المصرية لنظم التعليم في بورصة مصر يواصل الارتفاع ويصل الي سعر 0.864 جنيه مصري
Tăng giá
Bearish
Hôm qua
U.S. Treasury Yield Curve Steepening Highlights Monetary Policy Limitations
Tăng giá
Bearish
Hôm qua
ارتفاع قوي في سهم التعمير والاستشارات الهندسية المتداول في بورصة مصر
Tăng giá
Bearish
Hôm qua
INTEL: Alameda (FTX) unstaked 194,861 $SOL ($25,545,060) four hours ago They have $SOL unlocks once per month
Tăng giá
Bearish
Hôm qua
21Shares’ TOXR XRP ETF Cleared by Cboe as Inflows Near $1 Billion
Tăng giá
Bearish

Hơn

Tin tức xu hướng

Hơn

Nâng cao quy trình làm việc của bạn: Các mô hình AI Claude mới của Anthropic đang đưa khả năng kiểm soát máy tính để bàn lên một tầm cao mới bằng cách thực hiện các tác vụ cho bạn

Anthropic ra mắt Claude 3.5 Sonnet và Haiku: Một bước tiến trong khả năng của AI

Có gì mới trong Claude 3.5 Sonnet?

So sánh Claude 3.5 Haiku như thế nào?

Việc sử dụng máy tính có ý nghĩa gì đối với nhà phát triển?

Biện pháp an toàn và cân nhắc về mặt đạo đức

Cập nhật trực tiếp

Tin tức xu hướng

普京震撼宣布！金砖国家联盟即将采用加密货币推动投资与发展

美联储官员Neel Kashkari抨击比特币言论遭加密市场强烈反驳

中国利用量子计算机首次攻破加密算法？全球市场热议潜在加密威胁

Scroll Airdrop không đạt được mục tiêu mặc dù được quảng cáo rầm rộ, việc phân bổ token khiến cộng đồng thất vọng khi SCR giảm 20%

Tỷ phú Michael Saylor có kế hoạch để lại khối tài sản Bitcoin của mình cho nhân loại như Satoshi Nakamoto

柯文哲冷钱包被查扣，密码成破案关键！专家：无助记词仍可申请资产冻结

Tranh cãi về người sáng tạo Bitcoin: Nỗi lo về an toàn khiến Peter Todd phải ẩn náu giữa những tuyên bố của Satoshi Nakamoto của Nhà làm phim HBO

“Người bạn thân” mất sạch 450.000 đô la tiền tiết kiệm cả đời sau khi CEO tiền điện tử kết nối với WiFi của mình

Người Nga trả tiền bằng tiền điện tử lợi dụng Darkweb để thuê những kẻ đốt phá trẻ tuổi: Liệu họ có phải là bộ mặt mới của tội phạm sử dụng tiền điện tử?

Nâng cao quy trình làm việc của bạn: Các mô hình AI Claude mới của Anthropic đang đưa khả năng kiểm soát máy tính để bàn lên một tầm cao mới bằng cách thực hiện các tác vụ cho bạn