NVIDIA เปิดตัว Fugatto โมเดล AI ใหม่ สามารถสร้างเสียงจากข้อความได้

NVIDIA เปิดตัว Fugatto โมเดล AI ใหม่ สร้างเสียงจากข้อความ
NVIDIA เปิดตัว Fugatto โมเดล AI ใหม่ สร้างเสียงจากข้อความ


NVIDIA เปิดตัว Fugatto โมเดล AI ตัวใหม่กับจุดเด่นที่สร้างสร้างและแก้ไขเสียงจากข้อความได้ 

Fugatto (Foundational Generative Audio Transformer Opus 1) ซึ่งถูกขนานนามว่าเป็น “มีดพกสวิสสำหรับเสียง” โมเดลนี้สามารถแปลงข้อความเป็นเสียงหรือแก้ไขไฟล์เสียงที่มีอยู่ เช่น เพลง เสียงพูด หรือเสียงอื่น ๆ ได้อย่างมีประสิทธิภาพ

NVIDIA ระบุว่า โมเดลFugatto ถูกพัฒนาขึ้นโดย โดยทีมนักวิจัย AI ระดับนานาชาติ มีความสามารถโดดเด่นในการรองรับหลายภาษาและหลายสำเนียง

“ราฟาเอล วาเย่”  นักวิจัยผู้อยู่เบื้องหลังโครงการและผู้จัดการฝ่ายวิจัยเสียงประยุกต์ของ NVIDIA กล่าวว่า เราต้องการสร้างโมเดลที่สามารถเข้าใจและสร้างเสียงได้อย่างเป็นธรรมชาติไม่ต่างจากมนุษย์ ความสามารถในการรองรับสำเนียงหลายสำเนียงและหลายภาษา

สำหรับการประยุกต์การใช้งานในโลกจริง NVIDIA เสนอแนวทางการใช้งานFugatto ในหลายสถานการณ์ อาทิเช่น สำหรับโปรดิวเซอร์เพลง สามารถสร้างต้นแบบเพลงได้อย่างรวดเร็ว และทดลองเปลี่ยนแปลงรูปแบบ เสียง หรือเครื่องดนตรีต่าง ๆ ได้อย่างง่ายดาย

ด้านการเรียนรู้ภาษานั้น ผู้ใช้งานสามารถสร้างสื่อการเรียนรู้ภาษาด้วยเสียงในสไตล์ที่ต้องการ

ส่วนวิดีโอเกมนั้น นักพัฒนาเกมสามารถใช้โมเดลนี้เพื่อสร้างเสียงที่เปลี่ยนแปลงตามสถานการณ์ในเกม หรือสร้างตัวแปรของเสียงที่บันทึกไว้ให้สอดคล้องกับการกระทำของผู้เล่น

นอกจากนี้ นักวิจัยยังพบว่าโมเดลสามารถทำภารกิจที่ไม่ใช่ส่วนหนึ่งของการฝึกล่วงหน้าได้ด้วยการปรับแต่งเล็กน้อย 

โมเดลสามารถรวมคำสั่งที่ได้รับการฝึกแยกกัน เช่น การสร้างคำพูดที่ฟังดูโกรธด้วยสำเนียงเฉพาะ หรือเสียงนกร้องระหว่างพายุฝนฟ้าคะนอง โมเดลสามารถสร้างเสียงที่เปลี่ยนแปลงไปตามเวลาได้เช่นกัน เช่น เสียงพายุฝนที่กระหน่ำขณะที่เคลื่อนตัวผ่านพื้นดิน

NVIDIA ไม่ได้ระบุว่าจะให้สาธารณชนเข้าถึงFugatto ได้หรือไม่ แต่โมเดลนี้ไม่ใช่เทคโนโลยี AI ตัวแรกที่สามารถสร้างเสียงจากข้อความแจ้งเตือนได้ Meta ได้เปิดตัวชุด AI โอเพนซอร์สที่สามารถสร้างเสียงจากคำอธิบายข้อความได้ Google มี AI แปลงข้อความเป็นเพลงของตัวเองที่เรียกว่าMusicLMซึ่งผู้คนสามารถเข้าถึงได้ผ่านเว็บไซต์ AI Test Kitchenของ บริษัท

https://www.engadget.com/ai/nvidias-new-ai-model-fugatto-can-create-audio-from-text-prompts-140017297.html?

https://thejournalistclub.com/nvidia-value-stock-overpass-apple-ai/