Máy Tính

So Sánh Audio Overviews: Vì Sao Tính Năng Của Gemini Vượt Trội Hơn NotebookLM?

Trang đăng ký NotebookLM hiển thị trên iPad, minh họa giao diện thân thiện của công cụ AI.

Google NotebookLM, trợ lý nghiên cứu mạnh mẽ sử dụng AI, đã mang đến vô số tính năng đột phá, trong đó Audio Overviews nổi bật như một điểm nhấn ấn tượng. Nếu bạn chưa từng trải nghiệm, tính năng này cho phép bạn biến các nguồn tài liệu của mình thành một tập podcast do hai MC ảo dẫn dắt. Chúng không chỉ hấp dẫn và thú vị mà còn pha chút hóm hỉnh, biến những chủ đề khô khan nhất thành nội dung dễ tiếp thu. Tuy nhiên, kể từ khi Audio Overviews của Gemini ra mắt, nhiều người dùng đã nhận thấy một sự khác biệt đáng kể, khiến tính năng này trên Gemini trở nên vượt trội hơn so với phiên bản gốc trên NotebookLM, đặc biệt trong bối cảnh nghiên cứu chuyên sâu.

Tôi đã sử dụng NotebookLM từ khi nó còn là một dự án thử nghiệm và tính năng Audio Overviews kể từ tháng 9 năm 2024. Ban đầu, Audio Overviews sử dụng sức mạnh của Gemini 1.5 Pro nhưng chỉ giới hạn trong NotebookLM. Mãi đến tháng 3 năm 2025, Google mới chính thức tích hợp Audio Overviews vào giao diện Gemini. Dù đã có một vài tuần kể từ khi ra mắt, tôi vẫn trung thành với NotebookLM cho đến gần đây. Và thật bất ngờ, trải nghiệm Audio Overviews trên Gemini đã nâng tầm tính năng vốn đã ấn tượng này lên một cấp độ mới.

Trang đăng ký NotebookLM hiển thị trên iPad, minh họa giao diện thân thiện của công cụ AI.Trang đăng ký NotebookLM hiển thị trên iPad, minh họa giao diện thân thiện của công cụ AI.

Audio Overviews của Gemini: Khả năng tương đồng nhưng trải nghiệm vượt trội

Cùng một ý tưởng, phong cách khác biệt

Cần phải khẳng định rõ ràng: khái niệm cốt lõi của Audio Overviews không thay đổi giữa NotebookLM và Gemini. Cả hai đều được trang bị bởi Gemini và đều tạo ra các bản tóm tắt âm thanh theo phong cách podcast với hai MC AI. Tuy nhiên, trải nghiệm sử dụng Audio Overviews trong Gemini có đôi chút khác biệt và ở một số khía cạnh, thậm chí còn tốt hơn.

Để sử dụng bất kỳ tính năng nào trong NotebookLM, bạn cần tạo một notebook và thêm các nguồn tài liệu vào đó. Sau đó, bạn có thể nhấp vào nút Generate (Tạo) dưới mục Audio Overview để tạo podcast AI từ các nguồn của mình. Với Audio Overviews, đó là tất cả những gì bạn có thể làm trong NotebookLM – mọi bản Audio Overview đều được tạo ra chỉ từ các nguồn bạn đã thêm vào notebook.

Giao diện người dùng của Gemini hiển thị quá trình tạo Audio Overview, minh họa tính năng tóm tắt âm thanh AI.Giao diện người dùng của Gemini hiển thị quá trình tạo Audio Overview, minh họa tính năng tóm tắt âm thanh AI.

Gemini đã nâng tầm điều này. Mặc dù Audio Overviews của Gemini cũng có thể biến các tài liệu bạn tải lên thành tóm tắt âm thanh, nhưng nó còn có thể chuyển đổi các báo cáo Deep Research thành các cuộc thảo luận âm thanh theo phong cách podcast. Cuối cùng, Audio Overviews của Gemini không chỉ giới hạn ở các nguồn bạn cung cấp. Mặc dù điều này có nghĩa là khả năng “ảo giác” (hallucination) có thể cao hơn so với NotebookLM, nhưng sự linh hoạt bổ sung này rất đáng giá, đặc biệt khi bạn muốn có một cái nhìn tổng quan rộng hơn về một chủ đề mà vượt ra ngoài tài liệu của riêng bạn.

Tôi cũng nhận thấy Audio Overviews của Gemini thường ngắn hơn nhiều so với những gì bạn nhận được từ NotebookLM, ngay cả khi bạn sử dụng cùng một nguồn tài liệu trong cả hai công cụ. Vì vậy, tôi đã sử dụng Audio Overviews của Gemini khi muốn có một cái nhìn tổng quan nhanh chóng và súc tích, còn NotebookLM thì dùng cho những bản tổng quan sâu hơn và dài hơn.

Gemini chuyển đổi báo cáo Deep Research thành Audio Overviews một cách tiện lợi

Tiết kiệm thời gian, bỏ qua bước xuất/nhập

Điều thực sự hấp dẫn tôi sử dụng Audio Overviews trong Gemini là sự tích hợp của nó với tính năng Deep Research (Nghiên cứu Chuyên sâu). Nếu bạn chưa từng dùng Deep Research của Gemini, nó hoạt động đúng như tên gọi. Bạn cung cấp cho Gemini thông tin chi tiết về một chủ đề bạn muốn nghiên cứu, nó sẽ xây dựng kế hoạch nghiên cứu, phân tích kết quả và sau đó tạo ra một báo cáo toàn diện. Chẳng hạn, trong một ví dụ, tôi yêu cầu Gemini sử dụng Deep Research để nghiên cứu về XDA.

Nó đã đưa ra một kế hoạch gồm 8 bước, bắt đầu từ việc nghiên cứu lịch sử hình thành và sứ mệnh của trang web, kết thúc bằng mức độ liên quan hiện tại của XDA. Deep Research đánh giá hàng chục trang web, bao gồm các diễn đàn cộng đồng như Reddit, điều này thực sự giúp nó vẽ nên một bức tranh toàn diện về chủ đề. Trong quá trình nghiên cứu, Gemini còn hiển thị toàn bộ quá trình tư duy, phương pháp nghiên cứu đang áp dụng và nơi nó thu thập thông tin. Ví dụ, trong trường hợp này, nó đã nghiên cứu 104 trang web, bao gồm Reddit, MuckRack, YouTube và nhiều hơn nữa.

Minh họa khái niệm năng suất AI, thể hiện sự tối ưu hóa công việc nhờ các công cụ trí tuệ nhân tạo như Gemini.Minh họa khái niệm năng suất AI, thể hiện sự tối ưu hóa công việc nhờ các công cụ trí tuệ nhân tạo như Gemini.

Giờ đây, đây là điểm mấu chốt: các báo cáo mà nó tạo ra rất… chuyên sâu. Báo cáo cuối cùng mà Gemini tạo ra trong ví dụ này dài đến mười chín trang! Đó là lúc Audio Overviews của Gemini phát huy tác dụng. Thay vì phải đọc hàng chục trang văn bản, bạn có thể chuyển đổi báo cáo thành một tập podcast ngay trong Gemini.

Trước khi Google thêm Audio Overviews vào giao diện Gemini, tôi thường tải báo cáo Deep Research về, tạo một notebook mới, tải nó lên làm nguồn và sau đó tạo Audio Overview. Giờ đây, với Audio Overviews được tích hợp trực tiếp vào Gemini, sự phiền toái đó đã biến mất. Sau khi báo cáo được tạo, tất cả những gì bạn cần làm là nhấp vào nút Create (Tạo) và chọn Audio Overview từ menu thả xuống. Tôi đã sử dụng cách tiếp cận này khi muốn vượt ra ngoài các nguồn tài liệu của mình mà không bị giới hạn bởi những gì đã tải lên notebook.

Tuy nhiên, Audio Overviews của Gemini vẫn chưa hoàn hảo

Tốt hơn ở một số mặt, nhưng thiếu sót ở những mặt khác

Tôi đã thấy Audio Overviews của NotebookLM rất ấn tượng, vì vậy ngay cả trước khi thử Gemini, tôi biết mình sẽ không thất vọng. Sự tích hợp với tính năng Deep Research, cùng với khả năng tạo Audio Overviews từ các nguồn tải lên tương tự như NotebookLM, đã khiến nó càng trở nên hấp dẫn. Nhưng điều đó không có nghĩa là chúng ngay lập tức tốt hơn NotebookLM. Audio Overviews của Gemini còn thiếu nhiều tính năng mà NotebookLM đã có.

Chẳng hạn, bạn có thể sử dụng chế độ tương tác trong NotebookLM để tham gia vào podcast và đặt câu hỏi hoặc chia sẻ ý kiến của riêng mình, điều mà tôi thấy rất tuyệt vời cho việc học tập. Ngược lại, phiên bản của Gemini hiện chỉ là trải nghiệm nghe một chiều. Ngoài ra, như tôi đã đề cập ở trên, Audio Overviews của Gemini thường ngắn hơn nhiều so với NotebookLM.

Nút "Tham gia" trong giao diện Audio Overview tương tác của NotebookLM, làm nổi bật khả năng đối thoại mà Gemini chưa có.Nút "Tham gia" trong giao diện Audio Overview tương tác của NotebookLM, làm nổi bật khả năng đối thoại mà Gemini chưa có.

NotebookLM thậm chí còn cho phép bạn chọn giữa các bản Audio Overviews ngắn hơn và dài hơn, nhưng Gemini không cung cấp bất kỳ quyền kiểm soát nào về độ dài của âm thanh. Ví dụ, bản Audio Overview mà Gemini tạo ra từ báo cáo Deep Research dài 19 trang chỉ có sáu phút.

Nếu bạn đã và đang sử dụng Audio Overviews của NotebookLM nhưng chưa thử phiên bản của Gemini, nghĩ rằng chúng giống nhau (như tôi đã từng nghĩ trong một thời gian dài), thì bạn đang bỏ lỡ rất nhiều, đặc biệt là khi làm việc với Deep Research. Hãy trải nghiệm ngay để thấy sự khác biệt và tối ưu hóa quy trình nghiên cứu của bạn. Bạn đã thử tính năng này trên Gemini chưa? Hãy chia sẻ trải nghiệm của bạn ở phần bình luận dưới đây!

Related posts

Reconya: Giải pháp toàn diện theo dõi và quản lý thiết bị mạng

Administrator

Bảo Vệ Nhà Thông Minh: Hướng Dẫn Sao Lưu Home Assistant và Node-RED Chi Tiết

Administrator

Intel Core i9-12900K: Sức Mạnh Vượt Trội Với Mức Giá Chưa Từng Có!

Administrator