Trong bối cảnh công nghệ bị chi phối bởi những cải tiến của OpenAI, thật dễ dàng để bỏ qua những bước tiến của Google trong trí tuệ nhân tạo. Tuy nhiên, bản cập nhật gần đây của Google cho công cụ NotebookLM đã gây phấn khích trong cộng đồng AI, mang đến một bước nhảy vọt bất ngờ về chức năng: tạo podcast từ nội dung đã viết của bạn. Tính năng này, được gọi là "Tổng quan âm thanh", sử dụng AI để biến văn bản phức tạp thành các cuộc thảo luận âm thanh hấp dẫn giữa hai người dẫn chương trình. Đối với những người đã thử nghiệm, kết quả không gì khác ngoài sự đột phá.
NotebookLM: Một cuộc cách mạng thầm lặng trong việc tạo nội dung được tăng cường bằng AI
Được phát hành vào năm 2023, NotebookLM của Google ban đầu được giới thiệu như một công cụ được thiết kế để giúp người dùng hiểu thông tin phức tạp bằng cách xử lý các tài liệu đã tải lên và tạo ra các phản hồi dựa trên tài liệu được cung cấp. Nhưng với hệ sinh thái rộng lớn của Google, khái niệm đơn giản này đã phát triển thành một thứ mạnh mẽ hơn nhiều so với một ứng dụng "nói chuyện với pdf của bạn".
NotebookLM nhanh chóng tích hợp các khả năng đa phương thức của Gemini, giúp không chỉ tóm tắt tài liệu mà còn tạo toàn bộ bài thuyết trình dựa trên tài liệu. Mặc dù đây đã là một bước tiến đáng kể, bản cập nhật mới nhất—Tổng quan về âm thanh—đã thu hút sự chú ý của mọi người bằng cách bổ sung một chiều hướng hoàn toàn mới: tạo podcast.
Cách thức hoạt động: Từ văn bản đến âm thanh chỉ bằng một cú nhấp chuột
Tính năng Tổng quan âm thanh cực kỳ đơn giản. Tải lên một tài liệu văn bản, nhấp vào một nút và xem hai người dẫn chương trình do AI tạo ra tham gia vào "cuộc lặn sâu sống động" vào nội dung. Họ không chỉ đọc văn bản—họ tóm tắt, phân tích và thậm chí là nói qua nói lại như thể họ đang trong một cuộc thảo luận thời gian thực. Khả năng tạo ra một cuộc trò chuyện năng động từ nội dung tĩnh này đã khiến người dùng sửng sốt.
Một người dùng đầu tiên đã mô tả kết quả sau khi sử dụng NotebookLM cho một bài luận sắp tới: "Bạn cần phải thử để tin. Nó tốt. Thực sự tốt. Có lẽ là công cụ AI sẵn sàng cho sản phẩm công nghệ hiện tại đáng kinh ngạc nhất mà tôi từng thấy kể từ ChatGPT."
Điểm khác biệt của Google Audio Overview là cách nó chuyển đổi văn bản thành định dạng podcast hấp dẫn một cách liền mạch. Nó không chỉ là tóm tắt; nó tạo ra các kết nối giữa các ý tưởng khác nhau, thêm sắc thái cảm xúc và diễn ra tự nhiên như một cuộc trò chuyện thực sự. Ngay cả các trích dẫn và tài liệu tham khảo cũng được đan xen một cách trôi chảy vào cuộc thảo luận, tạo cảm giác như thể hai người đồng dẫn chương trình hiểu biết đang phân tích nội dung theo thời gian thực.
Tại sao Google lại đánh giá thấp sản phẩm này?
Mặc dù Audio Overview có khả năng đáng chú ý, Google vẫn im lặng một cách đáng ngạc nhiên về tính năng này. Một số người suy đoán rằng Google cảnh giác với việc các mô hình giọng nói bị sử dụng sai mục đích, đặc biệt là khi xét đến những tranh cãi trong quá khứ về các sản phẩm AI của hãng như trình tạo hình ảnh Gemini, từng tạo ra một hỗn hợp kỳ lạ có tên là "pizza keo". Sự thận trọng này có thể hiểu được, nhưng không giải thích đầy đủ lý do tại sao Google lại hạ thấp một công cụ mang tính đột phá như vậy.
Thay vào đó, có vẻ như Google đang lựa chọn một chiến lược khác: để sản phẩm tự nói lên điều đó. Không giống như các lần ra mắt rầm rộ của OpenAI, Google không dựa vào các khoảnh khắc lan truyền trên Twitter hay các bản demo hào nhoáng để thu hút sự chú ý. Thay vào đó, họ đang tận dụng hệ sinh thái khổng lồ của mình và từ từ triển khai các tính năng này để người dùng khám phá.
Điều gì làm cho tính năng này ấn tượng đến vậy?
Một số nhà nghiên cứu và người có sức ảnh hưởng về AI, bao gồm Giáo sư Ethan Mollick, đã bày tỏ sự ngạc nhiên về hiệu suất của công cụ này. Trong một cuộc trình diễn, Mollick đã sử dụng cuốn sách của mình làm dữ liệu đầu vào và thấy rằng NotebookLM có thể tạo ra podcast, hướng dẫn học tập, dòng thời gian và FAQ từ văn bản. Khi nói đến podcast, Mollick đã bị cuốn hút, thúc giục mọi người "chỉ cần lắng nghe" kết quả.
Đối với nhiều người, chức năng podcast không chỉ là một mánh lới quảng cáo. Đây là một công cụ mạnh mẽ có ý nghĩa đối với việc tạo nội dung, giáo dục và năng suất cá nhân. Các máy chủ do AI điều khiển nắm bắt các điểm chính của một bài luận hoặc cuốn sách, phân tích các lập luận phức tạp và trình bày chúng theo cách dễ hiểu và hấp dẫn.
Một người dùng đã chia sẻ trải nghiệm của họ: "Tôi phải nói rằng tôi ngạc nhiên. Tôi đã thử nó với một trong những bài luận sắp tới của mình và nó khiến tôi nổi da gà. Những điểm chính vẫn ở đó, câu chuyện được kể theo trình tự thời gian nhưng với những bước nhảy hội thoại hấp dẫn này. Thật kỳ lạ."
Mặc dù podcast do AI tạo ra có thể không sánh được với chiều sâu và hiểu biết sâu sắc của văn bản gốc, nhưng khả năng nắm bắt được bản chất của tài liệu và truyền tải nó theo một định dạng thú vị là điều không thể phủ nhận. Trong một trường hợp, những người dẫn chương trình AI đã tham khảo một phép so sánh mà người viết đưa ra giữa những tình huống tiến thoái lưỡng nan về mặt đạo đức và bom nguyên tử—một phép so sánh mà người viết đã rất ngạc nhiên khi nghe được thảo luận một cách trôi chảy như vậy.
Bước tiếp theo của NotebookLM là gì?
Bản cập nhật này đã định vị NotebookLM là một đối thủ đáng gờm trong lĩnh vực AI, đặc biệt là khi người dùng khám phá ra nó hữu ích như thế nào. Nhưng mặc dù phiên bản hiện tại đáng kinh ngạc, vẫn còn chỗ để phát triển. Công nghệ vẫn đang phát triển và các phiên bản trong tương lai có thể cung cấp khả năng phân tích sắc thái hơn, khả năng truy cập rộng hơn và tùy chỉnh nhiều hơn.
Mặc dù có cách tiếp cận tiếp thị khiêm tốn, tính năng podcast của NotebookLM có tiềm năng định nghĩa lại cách chúng ta tương tác với nội dung viết. Trong thời đại mà nội dung âm thanh là vua, công cụ này được thiết lập để giúp người dùng tạo podcast hấp dẫn với nỗ lực tối thiểu, mở ra những khả năng mới cho cả người viết blog, nhà giáo dục và người sáng tạo nội dung.
Những hàm ý là rất lớn. Khi AI tiếp tục làm mờ ranh giới giữa văn bản, âm thanh và các dạng nội dung khác, các công cụ như NotebookLM có thể biến đổi cách chúng ta tạo ra và tiêu thụ thông tin. Có thể vẫn chưa hoàn hảo, nhưng rõ ràng là AI khiêm tốn của Google đã sẵn sàng tạo ra làn sóng—mỗi lần một podcast.