OpenAI, công ty nghiên cứu trí tuệ nhân tạo (AI) chịu trách nhiệm về ChatGPT, đã hoãn việc ra mắt tính năng Chế độ giọng nói rất được mong đợi, tính năng này đã được giới thiệu lần đầu tại sự kiện cập nhật sản phẩm vào tháng trước.
Công ty đã tuyên bố rằng họ cần "một tháng nữa". để tinh chỉnh thêm tính năng, một quyết định đã gây ra phản ứng dữ dội từ người dùng và cộng đồng AI.
Tính năng này cho phép người dùng giao tiếp với chatbot thông qua giọng nói và tham gia vào một cuộc trò chuyện nghe có vẻ rất tự nhiên.
Cuộc biểu tình có sự tương đồng với bộ phim khoa học viễn tưởng "Her"; có người bạn đồng hành ảo do Scarlett Johansson lồng tiếng.
Ngay sau khi ra mắt, Johansson đã đưa ra lời đe dọa pháp lý chống lại OpenAI vì giọng nói giống với giọng nói của cô, khiến công ty phải xóa giọng nói đó khỏi thư viện của mình.
Khi giải thích về sự chậm trễ, OpenAI thừa nhận rằng họ không thể tiến triển với phạm vi "alpha" hạn chế. phát hành tính năng này vào tháng 6 như dự định ban đầu, cho thấy rằng việc phát triển thêm là cần thiết.
Tính năng thoại được giới thiệu vào tháng 5, dự kiến ra mắt vào tháng 6
OpenAI ban đầu gợi ý về khả năng của trợ lý Chế độ giọng nói cho ChatGPT vào tháng 5, hứa hẹn một tính năng tương tác và biểu cảm có thể tham gia vào các cuộc trò chuyện sôi nổi, thời gian thực và thậm chí diễn giải nét mặt.
Tính năng này dự kiến sẽ được thử nghiệm alpha với một nhóm người đăng ký ChatGPT Plus được chọn vào tháng 6.
Thông báo này đã gây ra tranh cãi trên hai mặt: thứ nhất, do tính hiện thực và độ tin cậy đáng lo ngại của bộ phim, và thứ hai, vì những cáo buộc rằng bộ phim đã sử dụng giọng nói của Scarlett Johansson để bắt chước nhân vật của cô trong bộ phim "Her". ."
Giờ đây, OpenAI đã thông báo rằng Chế độ giọng nói cần thêm một tháng phát triển "để đáp ứng các tiêu chuẩn ra mắt của chúng tôi" với kế hoạch phát hành rộng rãi hơn cho tất cả người đăng ký Plus vào mùa thu.
Quyết định này đã làm dấy lên nhiều tranh cãi xung quanh trợ lý AI.
Công ty đã chỉ ra rằng sự chậm trễ là để thực hiện các cuộc thử nghiệm an toàn bổ sung, mặc dù thông tin chi tiết cụ thể về các cuộc thử nghiệm này vẫn chưa được cung cấp.
Tại sao lại chậm trễ?
OpenAI đã đưa ra một số lý do chung cho việc trì hoãn Chế độ giọng nói.
Công ty đã đề cập một cách mơ hồ rằng họ đang "nâng cao trải nghiệm người dùng" và chuẩn bị cơ sở hạ tầng để đáp ứng hàng triệu người dùng dự kiến sẽ tương tác với Chế độ giọng nói.
Tuy nhiên, một lý do khác mà OpenAI đã khéo léo giới thiệu có thể gây lo ngại: công ty đang "cải thiện khả năng của mô hình trong việc xác định và từ chối một số nội dung nhất định".
Điều này cho thấy Chế độ giọng nói có thể dễ xảy ra hành vi sai trái, có khả năng chỉ ra vấn đề an toàn sâu sắc hơn—hoặc điều mà ngành AI gọi một cách hoa mỹ là "sự điều chỉnh"—một vấn đề trước đây đã ảnh hưởng đến chatbot.
Những vấn đề này có thể phát sinh khi chatbot tạo ra nội dung không phù hợp hoặc có hại, một cách tự phát hoặc theo lời nhắc có chủ ý của người dùng.
OpenAI đã lên kế hoạch giới thiệu chế độ giọng nói mới cho một nhóm nhỏ người đăng ký trả phí vào khoảng thời gian này.
Tuy nhiên, do những thách thức này, tính năng này sẽ không khả dụng cho đến tháng 7 và thậm chí sau đó, tính năng này có thể bị hạn chế đáng kể, tính năng này sẽ được cung cấp đầy đủ cho tất cả người dùng bị trì hoãn cho đến mùa thu.
Độ trễ tính năng giọng nói gặp phải phản ứng dữ dội và chế nhạo
Bất chấp những lời giải thích được đưa ra, người dùng vẫn không hài lòng với tin tức này và thông báo của OpenAI đã vấp phải làn sóng chỉ trích từ cộng đồng AI.
Nhiều nhà phê bình đã nhanh chóng nêu bật lịch sử hứa hẹn quá mức và phân phối dưới mức của OpenAI, tương phản hiệu quả hoạt động của nó với các đối thủ cạnh tranh.
Một số người đã coi sự chậm trễ là "kéo thảm"," vì họ đã đăng ký ChatGPT Plus dựa trên sự đảm bảo ban đầu rằng Chế độ giọng nói sẽ sắp ra mắt.
Những người khác suy đoán rằng các bản demo ấn tượng được trình chiếu vào tháng 5 đã bị phóng đại một cách lừa dối, một chiến thuật chưa từng có tiền lệ.
Nói rộng hơn, nhiều người chỉ đơn giản chế nhạo việc OpenAI không có khả năng cung cấp sản phẩm.
Trong khi đó, đối thủ cạnh tranh Anthropic vừa tiết lộ một bản cập nhật quan trọng cho chatbot Claude, hiện được gọi là Claude 3.5.
AI Youtuber Matt Wolfe đã gợi ý rằng sự chậm trễ là một động thái chiến lược của OpenAI.
Benjamin De Kraker, người tạo ra FinalFrame AI, bày tỏ sự thất vọng, lưu ý rằng OpenAI thường quảng bá các tính năng mà sau này bị ngừng sử dụng do không được sử dụng hoặc không được quan tâm.
Sự chậm trễ cũng khiến người dùng xem xét lại giá trị đăng ký ChatGPT Plus của họ.
Nhà nghiên cứu y học người Peru Patrick Wieghardt cho biết ông có thể chấm dứt đăng ký của mình, trong khi một người dùng khác xác nhận rằng họ đã hủy đăng ký.
Một nhà xuất bản bản tin AI đã viết:
"Ngay bây giờ, tôi thấy chẳng ích gì khi trả tiền cho những gì bạn đang cung cấp miễn phí."
Một số nhà quan sát dự đoán rằng việc phát hành đầy đủ Chế độ giọng nói có thể còn vài tháng nữa.
Ryan Morrison, Biên tập viên AI tại Tom's Guide, ước tính rằng giữa tháng 11, sau cuộc bầu cử Hoa Kỳ, là khung thời gian thực tế hơn.
Thất bại mới nhất này, không liên quan đến thất bại PR trước đó liên quan đến giọng nói của Scarlett Johansson, chỉ khiến OpenAI bị giám sát chặt chẽ hơn và làm sâu sắc thêm sự thất vọng của những người ủng hộ nó.