Vibe (โปรแกรมถอดเสียง แปลเสียง เป็นตัวอักษร) : โปรแกรม Vibe เป็นโปรแกรม โอเพ่นซอร์ส (Open-Source) แจกฟรี ที่พัฒนาโดยใช้ภาษา Rust และ เฟรมเวิร์ก (Framework) Tauri สำหรับสร้างโปรแกรมแบบข้ามแพลตฟอร์ม จุดประสงค์หลักของโปรแกรมคือ การถอดเสียงไฟล์เสียง หรือวิดีโอแบบออฟไลน์ เพื่อออกมาเป็นข้อความ หรือตัวอักษร โดยใช้โมเดล Whisper ของ โอเพ่นเอไอ (OpenAI) ซึ่งสามารถรองรับหลายภาษา และมีความแม่นยำสูง
Vibe รองรับการใช้งานผ่าน ส่วนต่อประสานกราฟิกกับผู้ใช้ (GUI) และ แบบ การพิมพ์คำสั่ง (CLI) โดยสามารถเรียกใช้งานผ่าน Command Line ด้วยคำสั่งต่าง ๆ เช่น vibe --input file.mp3 --output transcript.txt หรือเปิด HTTP API ด้วย vibe --server เพื่อใช้งานผ่าน โปรแกรมเปิดเว็บ หรือว่า เว็บเบราว์เซอร์ (Web Browser) ได้อีกด้วย
และ โปรแกรมถอดเสียงเป็นข้อความ Vibe นี้ยังมีฟีเจอร์เสริม เช่น การสรุปเนื้อหาด้วย Claude API หรือ Ollama, การแปลภาษา, การแยกเสียงผู้พูด (Speaker Diarization), และการพิมพ์ผลลัพธ์โดยตรง รองรับไฟล์ผลลัพธ์หลายรูปแบบ เช่น SRT, VTT, TXT, PDF, DOCX และ JSON
ข้อมูลเพิ่มเติม : API คืออะไร ? ประเภทของ API มีอะไรบ้าง ? พร้อมตัวอย่างการใช้งาน API ที่พบได้ทั่วไป
โปรแกรมถอดเสียงเป็นข้อความ Vibe เป็นซอฟต์แวร์ ฟรี (Free) ที่พัฒนาแบบโอเพ่นซอร์สที่อยู่ภายใต้เงื่อนไขการใช้งานแบบ MIT License ซึ่งเป็นสัญญาอนุญาตแบบเสรีที่ให้สิทธิ์ผู้ใช้ในการใช้งาน, แก้ไข และแจกจ่ายซอฟต์แวร์ได้อย่างอิสระ ได้ฟรีทั้งในเชิงส่วนตัว และเชิงพาณิชย์
หากต้องการค้นหาข้อมูลเพิ่มเติม สามารถติดต่อกับทางผู้พัฒนาโปรแกรมนี้ได้ผ่านทางช่องทางเว็บไซต์ (Website) : https://thewh1teagle.github.io/vibe/features (ภาษาอังกฤษ) ได้เลย
Vibe is an open-source program developed using the Rust programming language and the Tauri framework to create cross-platform applications. Its primary purpose is to perform offline transcription of audio or video files using OpenAI’s Whisper model, which supports multiple languages and delivers high accuracy.
Vibe offers both a graphical user interface (GUI) and command-line interface (CLI). Users can invoke it via command line with commands such as "vibe --input file.mp3 --output transcript.txt", or launch an HTTP API using "vibe --server" to interact through a web browser.
The program also includes additional features such as content summarization via the Claude API or Ollama, language translation, speaker diarization, and direct output formatting. It supports multiple output formats including SRT, VTT, TXT, PDF, DOCX, and JSON.