Η Nvidia διαθέτει σε όλους την τεχνολογία AI για φωνητικό animation - Πώς λειτουργεί το Audio2Face / FOXreport.gr

Η Nvidia ανακοίνωσε ότι διαθέτει ως open source το Audio2Face, το εργαλείο τεχνητής νοημοσύνης που δημιουργεί ρεαλιστικές κινήσεις προσώπου για 3D avatars με βάση φωνητικά δεδομένα.

Πλέον, οποιοσδήποτε προγραμματιστής μπορεί να χρησιμοποιήσει το εργαλείο και το πλαίσιο λειτουργίας του για να δημιουργήσει ρεαλιστικούς χαρακτήρες σε παιχνίδια ή εφαρμογές, αξιοποιώντας μόνο τον ήχο.

Πώς λειτουργεί το Audio2Face

Το Audio2Face αναλύει ακουστικά χαρακτηριστικά της φωνής και παράγει δεδομένα animation, τα οποία αντιστοιχίζονται σε εκφράσεις προσώπου και κίνηση των χειλιών του 3D χαρακτήρα. Το σύστημα μπορεί να αξιοποιηθεί τόσο σε προ-ηχογραφημένο περιεχόμενο όσο και σε ζωντανές μεταδόσεις (livestreams).

Ήδη σε χρήση από developers

Ορισμένοι developers έχουν ήδη ενσωματώσει το εργαλείο στα projects τους. Παραδείγματα:

Το Chernobylite 2: Exclusion Zone από την Farm51
Το Alien: Rogue Incursion Evolved Edition

Διαθέσιμα και τα εργαλεία εκπαίδευσης

Μαζί με το λογισμικό και τα software development kits (SDKs), η Nvidia προσφέρει και το training framework του εργαλείου, δίνοντας τη δυνατότητα στους χρήστες να προσαρμόσουν τα μοντέλα για διαφορετικές εφαρμογές και σενάρια χρήσης.

Η Nvidia διαθέτει σε όλους την τεχνολογία AI για φωνητικό animation – Πώς λειτουργεί το Audio2Face

Πώς λειτουργεί το Audio2Face

Ήδη σε χρήση από developers

Διαθέσιμα και τα εργαλεία εκπαίδευσης

ENIKOS NETWORK

Κυκλώνας Μελίσα: 43 νεκροί στην Αϊτή, τουλάχιστον 76 στην Καραϊβική

Χοσέ Λουίς Μεντιλίμπαρ: «Δεν είμαστε η καλύτερη ομάδα της διοργάνωσης, όμως παλεύουμε σε κάθε παιχνίδι»

7 χαρακτηριστικά που έχουν όσοι τρώνε μετά τις 9 το βράδυ

ΕΟΦ: Τέσσερα σκευάσματα ινσουλίνης αποσύρονται έως το τέλος του έτους

Μάριος Καλογεράς- Τέμπος: Ποιος είναι ο μεταβατικός CEO των ΕΛΤΑ

Γιάννης Στουρνάρας: Η μεταποίηση μοχλός ανάπτυξης για την ελληνική οικονομία