Η Alibaba ηγείται επένδυσης 290 εκατομμυρίων δολαρίων για τη δημιουργία μοντέλων κόσμου

Alibaba

Η Alibaba Cloud ηγήθηκε ενός επενδυτικού γύρου ύψους 2 δισεκατομμυρίων γιουάν στην startup ShengShu, η οποία βρίσκεται πίσω από το εργαλείο παραγωγής βίντεο Vidu.

Η κίνηση αυτή σηματοδοτεί μια στρατηγική στροφή προς την ανάπτυξη τεχνολογίας προσομοίωσης του πραγματικού κόσμου, υπερβαίνοντας τους περιορισμούς των παραδοσιακών μεγάλων γλωσσικών μοντέλων που βασίζονται κυρίως στο κείμενο. Στη χρηματοδότηση συμμετείχαν επίσης οι TAL Education και Baidu Ventures, αναδεικνύοντας το έντονο ενδιαφέρον για τη νέα γενιά τεχνητής νοημοσύνης.

Από τα chatbots στα μοντέλα προσομοίωσης του φυσικού κόσμου

Η ShengShu στοχεύει στην ανάπτυξη ενός γενικού μοντέλου κόσμου που θα γεφυρώνει τον ψηφιακό κόσμο των παιχνιδιών και των βίντεο με τον φυσικό κόσμο της αυτόνομης οδήγησης και των ρομπότ.

Σε αντίθεση με τα LLMs που εκπαιδεύονται σε κείμενο, αυτά τα μοντέλα βασίζονται σε πολυτροπικά δεδομένα όπως η όραση, ο ήχος και η αφή. Σύμφωνα με την εταιρεία, αυτή η προσέγγιση επιτρέπει στην τεχνητή νοημοσύνη να συλλαμβάνει με πιο φυσικό τρόπο τον τρόπο λειτουργίας του φυσικού κόσμου, συνδέοντας την αντίληψη με τη δράση.

Η σημασία των World Models για τη ρομποτική

Η ανάπτυξη τέτοιων μοντέλων θεωρείται κρίσιμη για την πρόοδο της ρομποτικής και της ενσώματης τεχνητής νοημοσύνης. Ενώ τα chatbots έχουν καλύψει το κομμάτι της γνώσης, τα ρομπότ απαιτούν μια βαθύτερη κατανόηση του φυσικού χώρου και των συνεπειών των κινήσεών τους. Η ShengShu έχει ήδη συνάψει στρατηγικές συνεργασίες με εταιρείες που αναπτύσσουν ανθρωποειδή ρομπότ για βιομηχανική, εμπορική και οικιακή χρήση, επιδιώκοντας να δημιουργήσει συστήματα που μπορούν να προβλέπουν τη συμπεριφορά στον πραγματικό κόσμο με συνέπεια.

Στρατηγικές επενδύσεις της Alibaba στην Κίνα

Η Alibaba έχει εντείνει τις επενδύσεις της σε παρεμφερείς startups, όπως η Tripo AI, η οποία δημιουργεί τρισδιάστατα ψηφιακά μοντέλα από φωτογραφίες, και η PixVerse, που επιτρέπει στους χρήστες να κατευθύνουν την εξέλιξη ενός βίντεο κατά τη διάρκεια της παραγωγής του.

Παράλληλα, η εταιρεία έχει κυκλοφορήσει δικά της μοντέλα ανοιχτού κώδικα για την παραγωγή βίντεο και τον έλεγχο ρομπότ. Ο ανταγωνισμός στον τομέα είναι έντονος, με εταιρείες όπως η Kuaishou και η ByteDance να έχουν ήδη παρουσιάσει παρόμοια εργαλεία, ενώ η κινεζική αγορά δείχνει να κινείται ταχύτερα από τη διεθνή σε ορισμένους τομείς της παραγωγικής τεχνητής νοημοσύνης.

Scroll to Top