Anthropic ra mắt Claude 3.5 Sonnet và Haiku: Một bước tiến trong khả năng của AI
Anthropic vừa ra mắt các mô hình AI mới nhất, Claude 3.5 Sonnet và Claude 3.5 Haiku, tự hào có những cải tiến đáng kể so với các phiên bản trước.
Mô hình Claude 3.5 Sonnet, được cập nhật chỉ bốn tháng sau lần phát hành đầu tiên, hiện còn vượt trội hơn nữa về khả năng lập trình, một lĩnh vực mà nó đã được coi là tiên phong.
Trong khi đó, Claude 3.5 Haiku hứa hẹn sẽ mang lại hiệu suất ngang bằng với mẫu máy tiên tiến nhất trước đây là Claude 3 Opus, trong khi vẫn tiết kiệm chi phí và hiệu quả.
Có gì mới trong Claude 3.5 Sonnet?
Mô hình Claude 3.5 Sonnet giới thiệu một tính năng cải tiến: Sử dụng máy tính.
Điều này cho phép mô hình thực hiện các tác vụ thường dành riêng cho con người bằng cách tương tác với môi trường máy tính để bàn.
Bằng cách tận dụng khả năng duyệt web, Claude 3.5 Sonnet hiện có thể thực hiện các lệnh ở cấp độ máy tính để bàn.
Điều này có nghĩa là nó có thể điều khiển các ứng dụng phần mềm và sử dụng các trang web như con người.
Theo Anthropic,
“Phản hồi ban đầu của khách hàng cho thấy Claude 3.5 Sonnet nâng cấp là bước tiến đáng kể trong mã hóa hỗ trợ AI.”
Mặc dù những lợi ích là rõ ràng, nhưng vẫn còn lo ngại về tính tự chủ của AI.
Anthropic đảm bảo với người dùng rằng họ sẽ vẫn nắm quyền kiểm soát.
Thông qua lời nhắc cụ thể, người dùng có thể hướng dẫn Claude thực hiện hành động, chuyển thành lệnh máy tính để thực hiện nhiệm vụ.
Đáng chú ý, hiệu suất của Claude trên các chuẩn mực của ngành đã có sự cải thiện đáng kể, đạt 49% trên bảng xếp hạng SWE-bench Verified, tăng từ mức 33,4%.
Kết quả này đưa Claude 3.5 Sonnet lên vị trí cao hơn các mô hình hiện có khác, bao gồm cả các sản phẩm mới nhất của OpenAI.
So sánh Claude 3.5 Haiku như thế nào?
Mẫu Claude 3.5 Haiku sắp ra mắt dự kiến sẽ sớm ra mắt và hướng tới mục tiêu sánh ngang với mẫu tiền nhiệm Claude 3 Opus, đồng thời vẫn giữ nguyên tốc độ và chi phí như mẫu Haiku ban đầu.
Mô hình này nổi bật vì độ trễ thấp và khả năng tuân theo hướng dẫn được cải thiện.
Anthropic mô tả nó đặc biệt phù hợp với các sản phẩm và nhiệm vụ hướng đến người dùng, đòi hỏi tương tác nhanh với các tập dữ liệu lớn, chẳng hạn như phân tích lịch sử mua hàng hoặc hồ sơ hàng tồn kho.
Với hiệu suất vượt trội, Claude 3.5 Haiku được thiết kế để có hiệu suất cao, tự hào có những cải tiến trên mọi kỹ năng so với phiên bản trước.
Ví dụ, sản phẩm đạt được số điểm 40,6% trên bảng xếp hạng SWE-bench Verified, vượt qua nhiều mẫu sản phẩm công khai, bao gồm cả Claude 3.5 Sonnet nguyên bản.
Việc sử dụng máy tính có ý nghĩa gì đối với nhà phát triển?
Tính năng Sử dụng máy tính đánh dấu thời điểm quan trọng cho tương tác AI.
Claude 3.5 Sonnet hiện có thể "xem" giao diện máy tính thông qua ảnh chụp màn hình, cho phép điều hướng và tương tác trực tiếp với giao diện người dùng.
Các nhà phát triển có thể hướng dẫn Claude tự động hóa các tác vụ lặp đi lặp lại, cho phép quy trình làm việc hiệu quả hơn.
Anthropic chia sẻ: "Chúng tôi rất ngạc nhiên về tốc độ khái quát hóa của Claude từ khóa đào tạo sử dụng máy tính mà chúng tôi cung cấp", đồng thời nhấn mạnh khả năng chuyển đổi hướng dẫn của người dùng thành một loạt hành động hợp lý của mô hình.
Bất chấp những tiến bộ này, Anthropic thừa nhận rằng công nghệ này vẫn còn đang trong giai đoạn thử nghiệm và chưa hoàn hảo.
Người dùng nên thận trọng vì Claude có thể gặp khó khăn khi thực hiện các tác vụ cơ bản như cuộn và phóng to.
Bằng chứng giai thoại từ nhóm phát triển minh họa cho những điểm kỳ quặc của mô hình; ví dụ, có lần nó nhấp để dừng một bản ghi màn hình dài, dẫn đến mất cảnh quay.
Biện pháp an toàn và cân nhắc về mặt đạo đức
Việc giới thiệu những khả năng mạnh mẽ như vậy cũng đặt ra câu hỏi về khả năng sử dụng sai mục đích.
Anthropic đã phát triển các công cụ phân loại và bảo vệ mới để phát hiện việc sử dụng tính năng Sử dụng máy tính có hại.
Công ty vẫn cảnh giác về những tác động về mặt đạo đức của công nghệ này, lưu ý rằng nó có khả năng bị khai thác để phát tán thư rác, thông tin sai lệch hoặc các hoạt động gian lận.
Khi Claude 3.5 Sonnet có sẵn cho người dùng, sự mong đợi xung quanh việc ra mắt Claude 3.5 Haiku càng làm tăng thêm sự phấn khích về ý nghĩa của những tiến bộ này đối với mã hóa hỗ trợ AI và năng suất nói chung.