Home Assistant, nền tảng nhà thông minh hàng đầu, luôn là lựa chọn ưu việt để tự động hóa không gian sống của bạn. Được phát triển và quản lý bởi Open Home Foundation (OHF), Home Assistant không ngừng ra mắt các bản cập nhật và cải tiến mới. Song hành cùng Home Assistant là Piper, một tiện ích bổ trợ do OHF quản lý, hoạt động như một công cụ chuyển văn bản thành giọng nói (text-to-speech) cục bộ. Piper có khả năng sử dụng nhiều mô hình giọng nói tương thích (như GLaDOS) để tổng hợp giọng nói cho trợ lý giọng nói cục bộ của bạn. Mới đây, Piper vừa nhận được một bản cập nhật lớn, hứa hẹn nâng cao đáng kể trải nghiệm khi sử dụng với các mô hình ngôn ngữ lớn (LLM) cục bộ.
Bản cập nhật này, được triển khai trong Piper phiên bản 1.6.0, được nhấn mạnh trong changelog chính thức là “Thêm hỗ trợ truyền tải âm thanh theo từng ranh giới câu” (Add support for streaming audio on sentence boundaries). Điều này có nghĩa là thay vì phải chờ toàn bộ luồng văn bản được gửi đến Piper và sau đó mới tổng hợp giọng nói, Piper sẽ bắt đầu phát âm thanh ngay khi hoàn thành câu đầu tiên. Tính năng này sẽ giúp tăng tốc độ phản hồi giọng nói đáng kể trong nhiều trường hợp, đặc biệt khi sử dụng các LLM cục bộ để tạo ra câu trả lời. Ngay cả khi sử dụng AI dựa trên đám mây, bản cập nhật này cũng sẽ giúp giảm bớt một phần thời gian chờ.
Mặc dù bản cập nhật mới nhất của Piper đã có thể cài đặt ngay lập tức và tùy chọn kích hoạt đã có sẵn trong phần cài đặt cấu hình, hầu hết người dùng sẽ chưa thể sử dụng các khả năng streaming này ngay.
Giao diện trợ lý giọng nói Home Assistant đang hoạt động với tính năng nhận diện lệnh
Yêu Cầu Cập Nhật Home Assistant Tháng 7 Để Kích Hoạt Tính Năng Streaming Của Piper
Tính năng sẽ được kích hoạt sau một tuần nữa
Do tính chất liên kết chặt chẽ của nhiều tiện ích bổ trợ và tích hợp chính thức của Home Assistant, không có gì ngạc nhiên khi một tính năng mới trong tiện ích bổ trợ đôi khi lại yêu cầu Home Assistant phải được cập nhật trước. Đây chính xác là trường hợp của Piper; trừ khi bạn đang sử dụng nhánh beta, bạn sẽ cần phải đợi khoảng một tuần nữa trước khi tính năng này thực sự hoạt động. Đoạn văn sau đây đã được thêm vào các tệp dịch tiếng Anh của Piper:
“Kích hoạt hỗ trợ truyền tải âm thanh. Tính năng này tách văn bản tại ranh giới câu và truyền tải âm thanh khi nó đang được tạo ra. Yêu cầu ít nhất HA 2025.7.”
Home Assistant tuân theo lịch trình phát hành hàng tháng, với bản cập nhật gần đây nhất (tại thời điểm viết bài) là Home Assistant 2025.6.3. Các phiên bản mới của Home Assistant thường được lên lịch phát hành chính thức vào thứ Tư đầu tiên của tháng, sau một tuần thử nghiệm beta. Điều này có nghĩa là phiên bản Home Assistant tháng 7, 2025.7, dự kiến sẽ ra mắt chính thức vào ngày 2 tháng 7, với bản beta dự kiến vào ngày 25 tháng 6. Vì vậy, nếu bạn đang ở nhánh beta, bạn có thể chỉ cần chờ vài giờ, nhưng hầu hết người dùng sẽ cần đợi một tuần trước khi có thể bắt đầu sử dụng tính năng này.
Ảnh chụp màn hình ghi chú cập nhật Piper về yêu cầu phiên bản Home Assistant 2025.7 cho tính năng streaming audio
Vậy tại sao điều này lại quan trọng và là một bản nâng cấp lớn cho những người đam mê LLM cục bộ? Trước đây, bạn sẽ phải chờ toàn bộ quá trình tạo phản hồi hoàn tất trước khi Piper bắt đầu tạo âm thanh phù hợp. Nếu máy chủ xử lý các truy vấn của bạn (ví dụ: một máy chủ gia đình) chậm trong việc tạo văn bản, bạn có thể phải chờ hàng chục giây trong những trường hợp cực đoan để nghe phản hồi cho một truy vấn. Với thay đổi này, giọng nói sẽ được truyền tải ngay khi quá trình tạo câu đầu tiên hoàn tất, vì vậy bạn sẽ bắt đầu nghe phản hồi từ trợ lý giọng nói của mình ngay cả khi phần còn lại của văn bản vẫn đang được tạo ra trong nền.
Đây là một bước tiến lớn, và lý do nó hoạt động khá đơn giản. Thông thường, tốc độ tổng hợp giọng nói tương đối chậm hơn so với khả năng tạo token mỗi giây của nhiều máy đang chạy LLM cục bộ. Ví dụ, máy chủ gia đình của tôi có thể chậm hơn một chút khi tạo văn bản, nhưng các từ vẫn được tạo ra nhanh hơn so với tốc độ mà một trợ lý giọng nói thực sự đọc chúng. Bằng cách này, tôi có thể sử dụng tính năng truyền tải âm thanh và nhận phản hồi nhanh hơn nhiều, ngay cả khi văn bản chưa hoàn thành. Không chỉ người dùng LLM cục bộ mới được nâng cấp: khi sử dụng AI dựa trên đám mây, như các mô hình GPT của OpenAI hoặc nền tảng AI tạo sinh của Google, nó cũng sẽ giúp giảm một chút thời gian phản hồi, để bạn có thể nghe câu trả lời nhanh hơn.
Đây là một bản cập nhật lớn cho các trợ lý giọng nói nói chung khi tích hợp với Home Assistant, và bạn sẽ có thể sử dụng nó vào ngày 2 tháng 7 trên bất kỳ hệ thống nào sử dụng Piper. Nếu bạn không ở nhánh beta, bạn sẽ cần đợi, nhưng chắc chắn bản cập nhật này sẽ mang lại trải nghiệm đáng mong chờ.
Với khả năng tăng tốc độ phản hồi của trợ lý giọng nói AI, bản cập nhật Piper 1.6.0 đánh dấu một bước tiến quan trọng trong việc nâng cao trải nghiệm người dùng Home Assistant, đặc biệt là đối với những người đang khai thác sức mạnh của LLM cục bộ. Hãy đảm bảo bạn cập nhật Home Assistant lên phiên bản 2025.7 ngay khi có sẵn để tận hưởng những lợi ích vượt trội mà Piper mang lại. Đừng quên theo dõi blogcongnghe.net để cập nhật thêm nhiều tin tức và đánh giá công nghệ mới nhất!