Vào một buổi sáng tháng 5 năm 2026, tôi ngồi trước màn hình máy tính với hàng tá video mới từ Anthropic, OpenAI và các phòng lab hàng đầu thế giới. Tôi muốn chia sẻ ngay lập tức, nhưng rồi tôi tự hỏi: “Liệu cả ngày hôm nay của mình có phải dành hết cho việc viết, ghi âm, ghép hình, chỉnh sửa và đăng bài không?” Câu trả lời lúc đó là “Có”. Và tôi biết, nếu cứ tiếp tục như vậy, tôi sẽ sớm kiệt sức trước khi kịp lan tỏa những kiến thức quý giá này.
Đó chính là khoảnh khắc tôi quyết định thay đổi hoàn toàn cuộc chơi.
Tôi đã xây dựng NXT Podcast Generator – một hệ thống tự động hóa 80-90% toàn bộ quy trình tạo podcast video trên YouTube và website. Kết quả? Mỗi video chỉ tốn khoảng 1.8 USD chi phí API, và công việc thủ công của tôi chỉ còn lại… quay 60 giây giới thiệu và xử lý quảng bá. Phần còn lại, AI lo hết.
Đây là câu chuyện về cách một ý tưởng nhỏ đã tạo ra tipping point thực sự trong việc sản xuất nội dung AI tại Việt Nam.
Tại Sao Tôi Không Thể Tiếp Tục Làm Thủ Công?
Mỗi ngày, tôi muốn mang đến cho khán giả những cập nhật nóng hổi nhất về AI: từ Crawler Manager Agents của Anthropic đến những agent tự trị phức tạp nhất. Nhưng quy trình truyền thống đòi hỏi:
- Nghe và chép transcript
- Viết lại thành kịch bản hấp dẫn
- Thu âm hoặc dùng TTS đơn điệu
- Tìm và ghép hình nền
- Thiết kế thumbnail
- Ghép video, xuất file, viết metadata, đăng bài
Tôi từng mất 4-6 tiếng cho một video. Đó là con đường dẫn đến kiệt sức, chứ không phải đến sự sáng tạo.
Rồi tôi tự hỏi: “Nếu AI có thể làm 80-90% công việc, tại sao tôi không để nó làm?”
NXT Podcast Generator Ra Đời – Khi 3 Nhân Vật Thay Đổi Mọi Thứ
Tôi chọn Anthropic Sonnet 4.6 làm “bộ não” chính vì khả năng hiểu ngữ cảnh sâu, viết lại dài hơi tự nhiên và giữ được giọng điệu chuyên nghiệp nhưng gần gũi. (Đôi khi tôi chuyển sang phiên bản mạnh hơn cho những chủ đề cực kỳ phức tạp.)
Nhưng điểm đột phá thực sự nằm ở ba nhân vật: Trí, Tuệ và Mai.
Thay vì một giọng AI đơn điệu kể chuyện, tôi để ba nhân vật luân phiên kể chuyện. Trí mang tính logic sắc bén, Tuệ đưa ra góc nhìn triết lý sâu sắc, Mai là người kể chuyện ấm áp, kết nối cảm xúc. Họ đối thoại, phản biện, giải thích thuật ngữ khó một cách tự nhiên. Kết quả là nội dung trở nên sống động như một buổi trò chuyện thực thụ – không còn là “đọc script”.
Đây chính là chi tiết mà tôi tin sẽ tạo nên sự khác biệt lớn nhất.
8 Bước Tự Động Hóa – Từ Một Link Đến Video Hoàn Chỉnh
Quy trình diễn ra gần như ma thuật:
- Dán link YouTube gốc (ví dụ: video mới nhất của Anthropic về Crawler Manager Agents giúp production nhanh hơn).
- Hệ thống tự tải transcript – nếu video chưa có phụ đề, nó sẽ dùng speech-to-text để chuyển âm thanh thành văn bản.
- Viết lại & dịch sang tiếng Việt theo phong cách 3 nhân vật Trí – Tuệ – Mai. Sonnet 4.6 giữ nguyên thông tin cốt lõi nhưng biến nó thành câu chuyện hấp dẫn, dễ hiểu.
- Tạo giọng nói AI – chia nhỏ kịch bản, generate từng đoạn với giọng riêng cho từng nhân vật, sau đó ghép nối và chỉnh âm lượng để mượt mà tự nhiên.
- Tạo hình ảnh nền – AI sinh ra 10-20 hình ảnh chất lượng cao, có logo “Khởi Nghiệp Thời AI”, thay đổi liên tục theo nhịp kể chuyện.
- Tạo thumbnail tự động – theo phong cách “liquid glass iOS” hiện đại, có cả phiên bản vuông và dài cho các nền tảng khác.
- Tổng hợp video – ghép phần giới thiệu do tôi tự quay (1 phút), audio AI, hình nền động, hiệu ứng sóng âm (sau này tôi sẽ tích hợp After Effects), logo và xuất file.
- Đăng tải tự động – chỉ cần kéo thả 4 file (video, metadata, thumbnail, body script) vào hệ thống. NXT tự đăng lên YouTube + website, đồng thời chèn link chéo giữa hai nền tảng.
Toàn bộ quy trình từ link đến video xuất bản chỉ mất vài chục phút máy chạy, trong khi tôi chỉ cần kiểm tra nhanh và quay phần mở đầu.

Chi Phí Thực Tế: Chỉ 1.8 USD/Video
Với 18 video thử nghiệm, tổng chi phí API chỉ khoảng 3.25 USD – trung bình 1.8 USD mỗi video. Con số này bao gồm:
- Gọi Sonnet 4.6 để viết lại
- Text-to-speech cho ba nhân vật
- Tạo hình ảnh nền chất lượng cao
So với việc thuê người viết kịch bản, thu âm và edit, đây là mức chi phí gần như không tưởng.
Tích Hợp Đa Nền Tảng – Tạo Hệ Sinh Thái Nội Dung
Điều tôi tự hào nhất là sự kết nối giữa YouTube và website. Mỗi video trên YouTube đều có link dẫn đến bài viết chi tiết trên website, và ngược lại. Người xem có thể chọn xem video hoặc đọc sâu hơn. Đây chính là cách tôi xây dựng một hệ sinh thái nội dung bền vững thay vì chỉ “đăng bài”.
Bạn Có Thể Làm Gì Với Ý Tưởng Này?
Tôi chia sẻ câu chuyện này không phải để khoe khoang, mà để chứng minh một điều: thời đại của người sáng tạo nội dung đơn lẻ đã thay đổi.
Bạn không cần phải là lập trình viên xuất sắc để bắt đầu. Ý tưởng cốt lõi là:
- Chọn một mô hình AI mạnh về viết lại dài hơi (Sonnet 4.6 hiện đang dẫn đầu).
- Tạo “nhân vật” để nội dung không bị nhàm chán.
- Tự động hóa từng bước một, bắt đầu từ khâu tốn thời gian nhất.
Có lẽ kênh podcast của bạn sẽ không nói về AI. Có thể là tài chính cá nhân, sức khỏe, du lịch, hay bất kỳ lĩnh vực nào. Nguyên tắc vẫn giống nhau: để AI làm phần nặng nhọc, con người giữ lại phần sáng tạo và kết nối.
Câu Hỏi Thường Gặp (AEO)
Hỏi: Hệ thống NXT có mã nguồn mở không?
Đáp: Hiện tại tôi đang dùng cho kênh cá nhân. Trong tương lai gần, tôi sẽ cân nhắc chia sẻ framework hoặc hướng dẫn chi tiết hơn để cộng đồng cùng xây dựng.
Hỏi: Chất lượng giọng nói và hình ảnh có chuyên nghiệp không?
Đáp: Với prompt tốt và chỉnh sửa hậu kỳ nhẹ, chất lượng đã vượt xa mong đợi. Nhiều người xem không nhận ra đây là nội dung được tạo phần lớn bởi AI.
Hỏi: Tôi có cần quay video mỗi ngày không?
Đáp: Chỉ cần 60 giây giới thiệu. Phần còn lại AI lo. Tôi vẫn giữ phần “con người” này để tạo sự kết nối chân thật với khán giả.
Nếu bạn đang đọc bài viết này trên website của tôi, rất có thể bạn vừa xem video YouTube tương ứng. Đó chính là minh chứng sống cho hệ thống NXT đang hoạt động.
Tôi tin rằng đây chỉ là khởi đầu. Trong những tháng tới, tôi sẽ tiếp tục tinh chỉnh, thêm nhiều tính năng agent tự trị hơn, và chia sẻ hành trình một cách minh bạch nhất.
Bạn nghĩ sao về cách tiếp cận này? Bạn đang gặp khó khăn gì trong việc tạo nội dung đều đặn? Hãy để lại bình luận bên dưới hoặc gửi email cho tôi – tôi rất muốn nghe câu chuyện của bạn.
Và nếu bạn thấy hữu ích, hãy đăng ký kênh Khởi Nghiệp Thời AI và theo dõi website để không bỏ lỡ những cập nhật AI mới nhất – được tạo ra gần như hoàn toàn tự động.
Câu chuyện vẫn còn tiếp diễn.
Và lần này, AI sẽ là người kể cùng chúng ta.
