

Apple เปิดตัว MGIE (Multimodal Large-Language Model-Guided Image Editing) เป็นโปรแกรมสร้างภาพ ด้วยคำสั่ง AI ที่พัฒนาโดย Apple และมหาวิทยาลัยซานตา บราบารา
ลักษณะการทำงาน โปรแกรมดังกล่าวจะตีความหมายจากคำสั่งที่ผู้ใช้คีย์เข้ามาและสามารถแก้ไขภาพตามคำสีั่งได้อย่างแม่นยำ
ทั้งนี้ MGIE สามารถประมวลผลได้ทั้งข้อความและรูปภาพ โดยเป็นโปรแกรมแบบโอเพ่น ซอร์สที่สามารถเข้าไปใช้ได้ฟรี โดยมีเป้าหมายแก้ไขภาพด้วยคำอธิบายแบบง่ายๆ โดยไม่ต้องใช้ซอฟตแวร์แก้ไขภาพแบบเดิมๆ
ขณะเดียวกันยังสามารถแก้ไขภาพด้วยวิธีต่างๆ เช่นการครอปภาพ การปรับขนาด การหมุนภาพ และใช้ฟิลเตอร์กับรูปภาพผ่านทางข้อความแจ้งเท่านั้น เรียกว่าแก้ไขได้ทั้งทางตรงและอ้อม
เช่นการแก้ไขภาพพิซซ่า เมื่อต้องการแก้ไขเพียงแค่พิมพ์คำสั่ง “ทำให้ดีต่อสุขภาพ” ภาพที่ได้จะเติมท็อปปิ้งผักลงไป
นักวิจัยที่อยู่เบื้องหลัง MGIE เน้นย้ำถึงประสิทธิภาพในการแปลความตั้งใจที่รับรู้ด้วยภาพอย่างชัดแจ้งให้เป็นการแก้ไขรูปภาพที่จับต้องได้ ซึ่งก้าวไปไกลกว่าคำสั่งที่คลุมเครือ
การศึกษาที่ครอบคลุมในด้านต่างๆ ด้านการตัดต่อ แสดงให้เห็นความสามารถของ MGIE ในการเพิ่มประสิทธิภาพ ขณะเดียวกันก็รักษาประสิทธิภาพการแข่งขันไว้ได้
แม้ว่าจะไม่โดดเด่นในพื้นที่ generative AI เท่ากับยักษ์ใหญ่ในอุตสาหกรรมเช่น Microsoft, Meta หรือ Google แต่ Apple ก็ได้แสดงให้เห็นถึงความมุ่งมั่นในการพัฒนาเทคโนโลยี AI ที่ล้ำหน้า
ก่อนหน้านี้ ทิม คุก ซีอีโอ Apple ได้ระบุถึงความทะเยอทะยานของบริษัทที่จะรวมคุณสมบัติ AI เข้ากับอุปกรณ์ของตนมากขึ้นในอีกไม่กี่ปีข้างหน้า