
Pixelle-Video (โปรแกรมสร้างวิดีโอสั้นด้วย AI ทำครบจบในคำสั่งเดียว) : โปรแกรม Pixelle-Video เป็นโปรแกรมประเภท "AI Fully Automated Short Video Engine" หรือ "เครื่องยนต์ผลิตวิดีโอสั้นอัตโนมัติด้วย AI" ซึ่งได้รับการพัฒนาโดย AIDC-AI ทีมพัฒนา ปัญญาประดิษฐ์ (AI) ในเครือ Alibaba International Digital Commerce Group เพื่อเป็นทางเลือกในการประมวลผลวิดีโอด้วยตัวเอง โดยเป้าหมายหลักคือ การลดขั้นตอนที่ยุ่งยากในการตัดต่อ และสร้างสรรค์วิดีโอสั้นสำหรับแพลตฟอร์มต่าง ๆ เช่น Tiktok, Instagram, Reels หรือ YouTube Shorts โดยที่ผู้ใช้งานไม่จำเป็นต้องมีความรู้เรื่องการตัดต่อวิดีโอในระดับสูงเลย
แนวคิดการทำงานของโปรแกรม Pixelle-Video คือการแปลง "แนวคิด หรือหัวข้อ" (Topic Prompt) เพียงประโยคเดียวให้กลายเป็นวิดีโอสั้นที่เสร็จสมบูรณ์พร้อมใช้งาน โดยระบบหลังบ้านจะทำการเชื่อมต่อระบบ AI หลาย ๆ ตัวเข้ามาทำงานร่วมกันเป็นขั้นตอนแบบอัตโนมัติ (Pipeline)
การใช้งานจะเริ่มต้นจาก เมื่อผู้ใช้พิมพ์หัวข้อที่ต้องการ ระบบจะส่งข้อมูลไปให้ โมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT หรือ 通义千问 (Tongyi Qianwen) เพื่อเขียนสคริปต์ และบทพูดของวิดีโอ จากนั้นระบบจะสร้างรูปภาพ หรือคลิปวิดีโอสั้น ๆ ขึ้นมาเพื่อใช้เป็นภาพประกอบในแต่ละฉาก โดยผู้ใช้สามารถเชื่อมต่อกับเครื่องมือสร้างภาพชื่อดังอย่าง ComfyUI หรือ ส่วนต่อประสานโปรแกรมประยุกต์ (API) อย่าง RunningHub API ได้
ในขั้นตอนถัดมา ระบบจะนำสคริปต์ที่ได้ไปผ่านกระบวนการแปลงข้อความเป็นเสียงพูด (Text-to-Speech) เพื่อสร้างเสียงบรรยายที่เป็นธรรมชาติ พร้อมทั้งค้นหา และใส่ดนตรีประกอบที่เข้ากันกับเนื้อหาโดยอัตโนมัติ และในขั้นตอนสุดท้าย โปรแกรมจะใช้เครื่องมืออย่าง FFmpeg และ Playwright ในการรวมส่วนประกอบทั้งหมด ไม่ว่าจะเป็นเสียงบรรยาย, ภาพเคลื่อนไหว, ตัวอักษรซับไตเติล และดนตรีประกอบเข้าด้วยกัน ตามรูปแบบเทมเพลต ซึ่งมีให้เลือกทั้งแบบภาพนิ่งและภาพเคลื่อนไหว จนได้ออกมาเป็นไฟล์วิดีโอสำเร็จรูป
โครงสร้าง และหน้าตา ส่วนต่อประสานกับผู้ใช้ (UI) ของโปรแกรมนี้ถูกสร้างขึ้นด้วย เฟรมเวิร์ก (Framework) Streamlit ทำให้ใช้งานได้ง่ายผ่าน เว็บเบราว์เซอร์ (Web Browser) โดยแบ่งการทำงานออกเป็นสัดส่วนชัดเจน ตั้งแต่ส่วนการตั้งค่าระบบที่เปิดโอกาสให้ผู้ใช้เลือกได้ว่าจะใช้ AI จากผู้ให้บริการเจ้าไหน ส่วนการกรอกเนื้อหา, ส่วนปรับแต่งเสียงบรรยาย และส่วนจัดการภาพและวิดีโอ
ความโดดเด่นของ โปรแกรม Pixelle-Video คือความยืดหยุ่นสูงในด้านค่าใช้จ่าย และสเปกเครื่อง ผู้ใช้งานสามารถเลือกใช้บริการระบบ คลาวด์ (Cloud) ที่มีค่าใช้จ่าย หรือจะเลือกใช้งานแบบ "ฟรี 100%" ก็ได้ โดยการรันโมเดลภาษาผ่าน Ollama และประมวลผลภาพผ่าน ComfyUI ภายในเครื่องคอมพิวเตอร์ของตัวเองโดยตรง
นอกจากนี้แล้ว สำหรับผู้ใช้งาน ระบบปฏิบัติการ (OS) อย่าง วินโดวส์ (Windows) ตัวโปรแกรมยังมีชุดติดตั้งแบบคลิกเดียว (One-click package) ที่รวมสภาพแวดล้อมต่าง ๆ อย่าง Python และ FFmpeg มาให้ในตัว ทำให้ผู้ใช้ทั่วไปสามารถเริ่มต้นใช้งานได้ทันทีโดยไม่จำเป็นต้องมีทักษะด้านการเขียนโค้ดที่ซับซ้อน มุ่งเน้นไปที่กลุ่มนักสร้างคอนเทนต์, เอเจนซี่โฆษณา และนักพัฒนาที่ต้องการผลิตวิดีโอสั้นปริมาณมากในเวลาอันรวดเร็ว
สามารถแปลงแนวคิดหรือหัวข้อ (Prompt) เพียงประโยคเดียว ให้กลายเป็นวิดีโอสั้นที่เสร็จสมบูรณ์ได้โดยอัตโนมัติ ตั้งแต่การเขียนสคริปต์, สร้างภาพ, ลงเสียง ไปจนถึงการรวมไฟล์
รองรับการเชื่อมต่อกับโมเดลภาษาขนาดใหญ่ที่หลากหลาย เช่น OpenAI (GPT-4o/GPT-4o-mini), Qwen (通义千问) รวมถึงโมเดลภายในเครื่องผ่าน Ollama เพื่อเขียนบทพูด และแบ่งฉากในวิดีโอ
สามารถดึงภาพจากคลังรูปภาพ, สั่งเจนภาพใหม่ผ่าน ComfyUI เช่นโมเดล SDXL หรือ Flux หรือเชื่อมต่อกับบริการ RunningHub API เพื่อสร้างเนื้อหาทางภาพที่ตรงกับเนื้อหาสคริปต์
รองรับระบบเสียงคุณภาพสูงจาก Edge-TTS, OpenAI TTS และระบบอื่น ๆ ช่วยให้ได้เสียงพากย์ที่มีความเป็นธรรมชาติ และสอดคล้องกับอารมณ์ของวิดีโอ
ใช้ระบบเทมเพลต HTML ในการจัดวางองค์ประกอบ (Layout) ร่วมกับเครื่องมือ Playwright และ FFmpeg เพื่อเรนเดอร์ภาพเคลื่อนไหว, ซับไตเติล, ดนตรีประกอบ และเสียงพากย์รวมกันเป็นไฟล์วิดีโอ MP4
ส่วนติดต่อผู้ใช้งานแบบกราฟิก (GUI) ของโปรแกรมถูกออกแบบมาให้ควบคุมผ่านเว็บเบราว์เซอร์อย่างง่ายดาย แบ่งสัดส่วนการตั้งค่า API, การปรับแต่งเสียง, การเลือกคลังภาพ และการพรีวิววิดีโออย่างชัดเจน
รองรับการทำงานแบบ Offline/Local โดยผู้ใช้สามารถรันโมเดลทั้งหมด Ollama + ComfyUI บนเครื่องคอมพิวเตอร์ของตัวเองได้ ทำให้ไม่มีค่าบริการรายเดือน หรือค่า API
มีชุดโปรแกรมสำเร็จรูปสำหรับผู้ใช้ Windows ที่รวมเอาสภาพแวดล้อมที่จำเป็น เช่น Python, FFmpeg, Playwright ไว้ในตัว ช่วยให้ติดตั้ง และเริ่มใช้งานได้ทันทีโดยไม่ต้องพิมพ์คำสั่ง ส่วนติดต่อผู้ใช้แบบบรรทัดคำสั่ง (CLI) ใน Terminal
โปรแกรม Pixelle-Video เป็นซอฟต์แวร์ ฟรี (Free) ที่พัฒนาแบบ โอเพ่นซอร์ส (Open-Source) ที่อยู่ภายใต้เงื่อนไขการใช้งานแบบ Apache-2.0 License ซึ่งหมายความว่าผู้ใช้สามารถใช้งาน, ดัดแปลง, แจกจ่าย และเข้าถึง โค้ดต้นฉบับ (Source Code) ได้อย่างเสรี ภายใต้เงื่อนไขที่กำหนด
หากต้องการค้นหาข้อมูลเพิ่มเติม สามารถติดต่อกับทางผู้พัฒนาโปรแกรมนี้ได้ผ่านทางช่องทางเว็บไซต์ (Website) : https://github.com/AIDC-AI/Pixelle-Video (ภาษาอังกฤษ) ได้เลย
Pixelle-Video is an "AI Fully Automated Short Video Engine," developed by AIDC-AI, the artificial intelligence development team under the Alibaba International Digital Commerce Group. Created as an alternative to manual video processing, its primary goal is to eliminate the tedious steps of editing and creating short videos for platforms like TikTok, Instagram Reels, or YouTube Shorts, requiring absolutely no advanced video editing skills from the user.
The core concept of Pixelle-Video is to transform a single "Topic Prompt" into a complete, ready-to-use short video. The backend automatically coordinates multiple AI systems into a seamless pipeline. Once a user inputs a topic, the system sends the data to a Large Language Model (LLM) such as GPT or Qwen (Tongyi Qianwen) to write the video script and narration voiceover. Following this, the engine generates images or short video clips for each scene, allowing users to integrate with popular image generation tools like ComfyUI or the RunningHub API.
In the next step, the script is processed through a Text-to-Speech system to create a natural-sounding narration, while the system automatically sources and overlays matching background music. Finally, the program utilizes tools like FFmpeg and Playwright to assemble all components including the voiceover, visuals, subtitles, and background music into a pre-designed template, which offers both static and dynamic options, ultimately rendering the final, completed video file.
คำสำคัญ