
Phosphene (โปรแกรมสร้างภาพ และเสียง ด้วย AI ทำงานแบบ Local) : โปรแกรม Phosphene เป็นโปรแกรมสำหรับผู้ใช้ ระบบปฏิบัติการ (OS) อย่าง แมคโอเอส (macOS) ที่ทำงานด้วยชิป Apple Silicon โดยเฉพาะ หน้าที่หลักของโปรแกรมนี้คือการเป็น ส่วนติดต่อผู้ใช้งานแบบกราฟิก (GUI) สำหรับการสร้างวิดีโอ และเสียงด้วยเทคโนโลยี ปัญญาประดิษฐ์ (AI) แบบทำงานเบ็ดเสร็จภายในเครื่อง คอมพิวเตอร์ (PC) ของผู้ใช้งานเอง ระบบนี้ถูกออกแบบมาเพื่อลบข้อจำกัดในการพึ่งพาบริการระบบ คลาวด์ (Cloud) ทำให้ผู้ใช้ไม่ต้องสมัครสมาชิก, ไม่ต้องเสียค่าใช้จ่ายรายเดือน และไม่ต้องใช้ ส่วนต่อประสานโปรแกรมประยุกต์ (API) ใดๆ ในการทำงาน
กลไกการทำงานหลักของโปรแกรม Phosphene คือการนำโมเดลปัญญาประดิษฐ์สำหรับสร้างวิดีโอเวอร์ชันล่าสุดอย่าง LTX 2.3 มาครอบไว้ และสั่งให้ทำงานผ่าน เฟรมเวิร์ก (Framework) MLX ซึ่งเป็นเทคโนโลยีเฉพาะของ Apple เพื่อช่วยให้ชิปตระกูล M สามารถประมวลผลการสร้างวิดีโอได้อย่างมีประสิทธิภาพสูงสุด นอกจากนี้ผู้ใช้ยังสามารถติดตั้งโปรแกรมทั้งหมดพร้อมสภาพแวดล้อมที่จำเป็นได้อย่างง่ายดายในคลิกเดียวผ่านโปรแกรม Pinokio
ในด้านความสามารถในการสร้างสรรค์ โปรแกรม Phosphene รองรับการทำงานที่หลากหลาย ทั้งการพิมพ์ข้อความเพื่อสั่งให้สร้างเป็นวิดีโอ, การนำภาพนิ่งมาทำเป็นวิดีโอเคลื่อนไหว, การกำหนดภาพเริ่มต้นพร้อมภาพสุดท้ายเพื่อให้ AI สร้างวิดีโอเชื่อมต่อตรงกลางให้สมูท รวมไปถึงการต่อยอดคลิปวิดีโอเดิมที่มีอยู่แล้วให้มีความยาวเพิ่มขึ้นแบบไร้รอยต่อ นอกจากนี้ ยังมีฟีเจอร์ตัวช่วยอัจฉริยะที่ใช้โมเดลภาษา Gemma 3 มาช่วยเกลาคำสั่ง หรือพรอมต์ของผู้ใช้ให้มีโครงสร้างที่เหมาะสมกับโมเดล LTX 2.3 มากที่สุดเพื่อให้ได้ผลลัพธ์ที่สวยงาม และแม่นยำยิ่งขึ้น
สำหรับการใช้งานจริง ผู้ใช้สามารถเลือกระดับคุณภาพ และระยะเวลาในการเรนเดอร์ได้ถึงสี่ระดับ ตั้งแต่โหมดรวดเร็วสำหรับการทดสอบไอเดียคร่าว ๆ ไปจนถึงโหมดคุณภาพสูงสุดที่ต้องใช้เวลาประมวลผลนานแต่ให้ภาพคมชัด และลดความผิดเพี้ยน ระบบยังมีความชาญฉลาดในการตรวจจับขนาดหน่วยความจำ หรือ หน่วยความจำสำรอง (RAM) ของเครื่อง Mac ที่ใช้งานอยู่ตั้งแต่เริ่มเปิดโปรแกรม เพื่อทำการปรับแต่ง และปลดล็อกฟีเจอร์ต่าง ๆ ให้สอดคล้อง กับสเปคเครื่องโดยอัตโนมัติ โดยเครื่องที่มี RAM สูงระดับ 80 ถึง 120 GB ขึ้นไปจะสามารถสร้างวิดีโอที่มีความละเอียดสูง และยาวขึ้นได้โดยไม่มีข้อจำกัด ท้ายที่สุดในขั้นตอนการบันทึกไฟล์ โปรแกรมยังมีตัวเลือกในการส่งออกวิดีโอ และเสียงในหลากหลายรูปแบบ ไม่ว่าจะเป็นไฟล์ขนาดเล็กสำหรับเว็บไซต์ ไฟล์มาตรฐานสำหรับโซเชียลมีเดีย หรือไฟล์คุณภาพสูงสุดแบบไม่สูญเสียรายละเอียดสำหรับนำไปใช้งานในกระบวนการตัดต่อระดับมืออาชีพต่อไป
โปรแกรม Phosphene เป็นซอฟต์แวร์ ฟรี (Free) ที่พัฒนาแบบ โอเพ่นซอร์ส (Open-Source) ที่อยู่ภายใต้เงื่อนไขการใช้งานแบบ MIT License ซึ่งหมายความว่าผู้ใช้สามารถใช้งาน, ดัดแปลง, แจกจ่าย และเข้าถึง โค้ดต้นฉบับ (Source Code) ได้อย่างเสรี ภายใต้เงื่อนไขที่กำหนด
หากต้องการค้นหาข้อมูลเพิ่มเติม สามารถติดต่อกับทางผู้พัฒนาโปรแกรมนี้ได้ผ่านทางช่องทางเว็บไซต์ (Website) : https ://github.com/mrbizarro/phosphene (ภาษาอังกฤษ) ได้เลย
Phosphene is a program exclusively designed for macOS users operating on Apple Silicon chips. Its primary function is to serve as a graphical user interface (GUI) for generating video and audio using artificial intelligence (AI) technology, running entirely locally on the user's own computer (PC). This system is designed to eliminate the limitations of relying on cloud services, meaning users do not need to sign up for subscriptions, pay monthly fees, or use any application programming interfaces (APIs) to operate it.
The core mechanism of the Phosphene program involves wrapping the latest AI video generation model, LTX 2.3, and executing it through the MLX framework, a proprietary Apple technology. This enables M-series chips to process video generation with maximum efficiency. Additionally, users can easily install the entire program along with all necessary environments in a single click via the Pinokio program.
In terms of creative capabilities, Phosphene supports a wide variety of functions. These include typing text to generate video (text-to-video), animating still images (image-to-video), setting a starting image along with a final image for the AI to smoothly generate the connecting video in between, and seamlessly extending the length of existing video clips. Furthermore, it features a smart assistant utilizing the Gemma 3 language model to help refine and structure user prompts to best suit the LTX 2.3 model, resulting in more beautiful and accurate outputs.
คำสำคัญ