NVIDIA เปิดตัว Fugatto โมเดล AI ตัวใหม่กับจุดเด่นที่สร้างสร้างและแก้ไขเสียงจากข้อความได้
Fugatto (Foundational Generative Audio Transformer Opus 1) ซึ่งถูกขนานนามว่าเป็น “มีดพกสวิสสำหรับเสียง” โมเดลนี้สามารถแปลงข้อความเป็นเสียงหรือแก้ไขไฟล์เสียงที่มีอยู่ เช่น เพลง เสียงพูด หรือเสียงอื่น ๆ ได้อย่างมีประสิทธิภาพ
NVIDIA ระบุว่า โมเดลFugatto ถูกพัฒนาขึ้นโดย โดยทีมนักวิจัย AI ระดับนานาชาติ มีความสามารถโดดเด่นในการรองรับหลายภาษาและหลายสำเนียง
“ราฟาเอล วาเย่” นักวิจัยผู้อยู่เบื้องหลังโครงการและผู้จัดการฝ่ายวิจัยเสียงประยุกต์ของ NVIDIA กล่าวว่า เราต้องการสร้างโมเดลที่สามารถเข้าใจและสร้างเสียงได้อย่างเป็นธรรมชาติไม่ต่างจากมนุษย์ ความสามารถในการรองรับสำเนียงหลายสำเนียงและหลายภาษา
สำหรับการประยุกต์การใช้งานในโลกจริง NVIDIA เสนอแนวทางการใช้งานFugatto ในหลายสถานการณ์ อาทิเช่น สำหรับโปรดิวเซอร์เพลง สามารถสร้างต้นแบบเพลงได้อย่างรวดเร็ว และทดลองเปลี่ยนแปลงรูปแบบ เสียง หรือเครื่องดนตรีต่าง ๆ ได้อย่างง่ายดาย
ด้านการเรียนรู้ภาษานั้น ผู้ใช้งานสามารถสร้างสื่อการเรียนรู้ภาษาด้วยเสียงในสไตล์ที่ต้องการ
ส่วนวิดีโอเกมนั้น นักพัฒนาเกมสามารถใช้โมเดลนี้เพื่อสร้างเสียงที่เปลี่ยนแปลงตามสถานการณ์ในเกม หรือสร้างตัวแปรของเสียงที่บันทึกไว้ให้สอดคล้องกับการกระทำของผู้เล่น
นอกจากนี้ นักวิจัยยังพบว่าโมเดลสามารถทำภารกิจที่ไม่ใช่ส่วนหนึ่งของการฝึกล่วงหน้าได้ด้วยการปรับแต่งเล็กน้อย
โมเดลสามารถรวมคำสั่งที่ได้รับการฝึกแยกกัน เช่น การสร้างคำพูดที่ฟังดูโกรธด้วยสำเนียงเฉพาะ หรือเสียงนกร้องระหว่างพายุฝนฟ้าคะนอง โมเดลสามารถสร้างเสียงที่เปลี่ยนแปลงไปตามเวลาได้เช่นกัน เช่น เสียงพายุฝนที่กระหน่ำขณะที่เคลื่อนตัวผ่านพื้นดิน
NVIDIA ไม่ได้ระบุว่าจะให้สาธารณชนเข้าถึงFugatto ได้หรือไม่ แต่โมเดลนี้ไม่ใช่เทคโนโลยี AI ตัวแรกที่สามารถสร้างเสียงจากข้อความแจ้งเตือนได้ Meta ได้เปิดตัวชุด AI โอเพนซอร์สที่สามารถสร้างเสียงจากคำอธิบายข้อความได้ Google มี AI แปลงข้อความเป็นเพลงของตัวเองที่เรียกว่าMusicLMซึ่งผู้คนสามารถเข้าถึงได้ผ่านเว็บไซต์ AI Test Kitchenของ บริษัท
https://thejournalistclub.com/nvidia-value-stock-overpass-apple-ai/