Η Nvidia διαθέτει σε όλους την τεχνολογία AI για φωνητικό animation – Πώς λειτουργεί το Audio2Face

Nvidia

Η Nvidia ανακοίνωσε ότι διαθέτει ως open source το Audio2Face, το εργαλείο τεχνητής νοημοσύνης που δημιουργεί ρεαλιστικές κινήσεις προσώπου για 3D avatars με βάση φωνητικά δεδομένα.

Πλέον, οποιοσδήποτε προγραμματιστής μπορεί να χρησιμοποιήσει το εργαλείο και το πλαίσιο λειτουργίας του για να δημιουργήσει ρεαλιστικούς χαρακτήρες σε παιχνίδια ή εφαρμογές, αξιοποιώντας μόνο τον ήχο.

Πώς λειτουργεί το Audio2Face

Το Audio2Face αναλύει ακουστικά χαρακτηριστικά της φωνής και παράγει δεδομένα animation, τα οποία αντιστοιχίζονται σε εκφράσεις προσώπου και κίνηση των χειλιών του 3D χαρακτήρα. Το σύστημα μπορεί να αξιοποιηθεί τόσο σε προ-ηχογραφημένο περιεχόμενο όσο και σε ζωντανές μεταδόσεις (livestreams).

Ήδη σε χρήση από developers

Ορισμένοι developers έχουν ήδη ενσωματώσει το εργαλείο στα projects τους. Παραδείγματα:

  • Το Chernobylite 2: Exclusion Zone από την Farm51
  • Το Alien: Rogue Incursion Evolved Edition

Διαθέσιμα και τα εργαλεία εκπαίδευσης

Μαζί με το λογισμικό και τα software development kits (SDKs), η Nvidia προσφέρει και το training framework του εργαλείου, δίνοντας τη δυνατότητα στους χρήστες να προσαρμόσουν τα μοντέλα για διαφορετικές εφαρμογές και σενάρια χρήσης.

Scroll to Top