Abogen (โปรแกรมแปลงข้อความเป็นเสียง จากหนังสือ E-Book) : โปรแกรม Abogen เป็นโปรแกรมแปลงข้อความเป็นเสียง (Text-To-Speech) ที่ออกแบบมาเพื่อสร้างไฟล์เสียงคุณภาพสูงจาก ไฟล์ ePub, ไฟล์ PDF หรือข้อความธรรมดา พร้อมคำบรรยายที่ซิงก์ กับเสียงอย่างแม่นยำ โปรแกรมนี้เหมาะสำหรับการสร้างหนังสือเสียง (Audiobook), เสียงพากย์สำหรับแพลตฟอร์มโซเชียลมีเดีย เช่น Instagram, YouTube, TikTok หรือโปรเจกต์อะไรก็ตาม ที่ต้องการเสียงพูดที่ฟังดูเป็นธรรมชาติ โดยใช้โมเดล Kokoro-82M ซึ่งเป็นระบบสังเคราะห์เสียงที่มีคุณภาพสูง
ผู้ใช้สามารถลาก และวางไฟล์เข้าโปรแกรม หรือใช้เครื่องมือแก้ไขข้อความภายในตัวเพื่อเตรียมเนื้อหา จากนั้นสามารถกำหนดความเร็วในการพูด, เลือกเสียงที่ต้องการ หรือสร้างเสียงแบบกำหนดเองผ่านระบบ Voice Mixer เลือกรูปแบบคำบรรยาย เช่น แยกตามประโยค หรือจำนวนคำ และเลือกรูปแบบไฟล์เสียงที่ต้องการ เช่น WAV, MP3, FLAC, OPUS หรือ M4B ที่รองรับการแบ่งบท
โปรแกรมรองรับการจัดการไฟล์หลายรายการพร้อมกันผ่านโหมดคิว (Queue Mode) ซึ่งช่วยให้สามารถแปลงไฟล์จำนวนมากได้ในคราวเดียว โดยแต่ละไฟล์สามารถตั้งค่าต่างกันได้ นอกจากนี้ ยังรองรับการแยกบทจากไฟล์ ePub หรือ PDF และสามารถสร้างไฟล์เสียงแยกตามบท หรือรวมเป็นไฟล์เดียวก็ได้ พร้อมจัดเก็บ ข้อมูลของข้อมูล (Metadata) เช่น ชื่อหนังสือ, ผู้แต่ง, ปี และประเภท เพื่อให้ใช้งานร่วมกับเครื่องเล่น Audiobook ได้อย่างมีประสิทธิภาพ
Abogen รองรับการใช้งานบน ระบบปฏิบัติการ (OS) วินโดวส์ (Windows), แมคโอเอส (macOS) และ ลีนุกซ์ (Linux) โดยมีตัวติดตั้งแบบสคริปต์สำหรับ Windows ที่สามารถติดตั้งทุกอย่างโดยไม่ต้องมี Python สำหรับผู้ใช้ที่มี กราฟิกการ์ด (GPU) ของ NVIDIA โปรแกรมรองรับ CUDA เพื่อเร่งการประมวลผลเสียง ส่วนผู้ใช้ AMD GPU จะต้องใช้บน Linux เนื่องจาก ROCm ยังไม่รองรับบน Windows
โดยรวมแล้ว Abogen เป็นเครื่องมือที่ทรงพลัง และยืดหยุ่นสำหรับการสร้างเนื้อหาเสียงจากข้อความ โดยเน้นความเร็ว, ความแม่นยำ และความสามารถในการปรับแต่งเสียง และคำบรรยายให้เหมาะกับผู้ใช้แต่ละราย
โปรแกรมแปลงข้อความเป็นเสียง Abogen เป็นซอฟต์แวร์ ฟรี (Free) ที่พัฒนาแบบ โอเพ่นซอร์ส (Open-Source) ภายใต้ใบอนุญาตแบบ MIT License ซึ่งหมายความว่าเราสามารถดาวน์โหลด, ใช้งาน, แก้ไข และแจกจ่ายได้อย่างอิสระ
หากต้องการค้นหาข้อมูลเพิ่มเติม สามารถติดต่อกับทางผู้พัฒนาโปรแกรมนี้ได้ผ่านทางช่องทางเว็บไซต์ (Website) : https://github.com/denizsafak (ภาษาอังกฤษ) ได้เลย
Abogen is a Text-To-Speech (TTS) application designed to generate high-quality audio files from ePub, PDF, or plain text sources, complete with precisely synchronized subtitles. It is well-suited for creating audiobooks, voiceovers for social media platforms such as Instagram, YouTube, and TikTok, or any project that requires natural-sounding speech. The system is powered by Kokoro-82M, a high-fidelity speech synthesis model.