Η νέα προηγμένη λειτουργία φωνής του ChatGPT, η Advanced Voice, έγινε διαθέσιμη σε επιλεγμένους συνδρομητές της OpenAI, φέρνοντας μια επανάσταση στον τρόπο που αλληλοεπιδρούν η χρήστες με την ΑΙ (τεχνητή νοημοσύνη).
Το χαρακτηριστικό αυτό, που ανακοινώθηκε για πρώτη φορά τον Μάιο, σχεδιάστηκε για να αντικαταστήσει το παραδοσιακό κείμενο με φυσικές, προφορικές συνομιλίες που αποδίδονται με ρεαλιστικό τρόπο. Λειτουργεί σε πολλές γλώσσες και τοπικές προφορές, προσφέροντας πιο φυσικές συνομιλίες σε πραγματικό χρόνο.
Οι περιορισμοί της λειτουργίας φωνής
Η λειτουργία φωνής του ChatGPT έχει συγκεκριμένους περιορισμούς. Το σύστημα μπορεί να μιλήσει μόνο σε μία από τις τέσσερις προκαθορισμένες φωνές και δεν είναι ικανό να μιμηθεί άλλες φωνές ή να δημιουργήσει ήχο που προστατεύεται από πνευματικά δικαιώματα. Εντούτοις, ορισμένοι χρήστες έχουν ήδη βρει δημιουργικούς τρόπους να εκμεταλλευτούν τη νέα δυνατότητα.
Advanced Voice ως B-boy
Ενδιαφέρον προξενεί η ικανότητα του AI να κάνει beatbox. Στην ανάρτησή του στο X (πρώην Twitter), ο Sutin μοιράζεται ένα νήμα με διάφορες απαντήσεις της Advanced Voice, συμπεριλαμβανομένου ενός «ραπ γενεθλίων» και ενός beatbox, που περιλαμβάνει ψηφιακή αναπνοή ανάμεσα στα χτυπήματα.
Yo ChatGPT Advanced Voice beatboxes pic.twitter.com/yYgXzHRhkS
— Ethan Sutin (@EthanSutin) July 30, 2024
Advanced Voice ως αφηγητής
Η Advanced Voice μπορεί επίσης να δημιουργήσει ηχητικά εφέ φόντου για ιστορίες πριν τον ύπνο. Στο παράδειγμα του Kesku, η τεχνητή νοημοσύνη προσθέτει ηχητικά εφέ όπως θρόισμα καταιγίδας για να ενισχύσει την ατμόσφαιρα της ιστορίας του.
This is awesome actually
I did not expect the ominous sounds https://t.co/SgEPi5Bd3K pic.twitter.com/DnK8AVdWjV
— Kesku (@yoimnotkesku) July 30, 2024
Advanced Voice ως συναισθηματικό ηχείο
Η δυνατότητα να μεταδίδει συναισθήματα είναι μία από τις εντυπωσιακές πτυχές της Advanced Voice. Ο χρήστης Ethan Sutin αναδημιουργεί την εμβληματική σκηνή από το Star Trek II, ενώ ο Cristiano Giardina χρησιμοποιεί την AI για να μιλήσει σε διαφορετικούς τόνους και γλώσσες.
Khan!!!!!! pic.twitter.com/xQ8NdEojSX
— Ethan Sutin (@EthanSutin) July 30, 2024
ChatGPT Advanced Voice Mode speaking Armenian (regular, excited, angry) pic.twitter.com/SKm73lExdX
— Cristiano Giardina (@CrisGiardina) July 31, 2024
Advanced Voice ως φιλόζωος
Η Advanced Voice μπορεί να μιμείται και ήχους ζώων, όπως αποδεικνύει ένα παράδειγμα όπου το AI κάνει ήχους γάτας με εξαιρετική ακρίβεια. Οι χρήστες μπορούν επίσης να ρωτήσουν την τεχνητή νοημοσύνη για βιολογικές πληροφορίες σχετικά με αιλουροειδή.
— Ethan Sutin (@EthanSutin) July 30, 2024
H Advanced Voice ως μεταφραστής σε πραγματικό χρόνο
Η λειτουργία φωνής μπορεί να αξιοποιήσει την κάμερα της συσκευής σας για να βοηθήσει στη μετάφραση κειμένων. Στο παράδειγμα του Manuel Sainsily, η AI διαβάζει το κείμενο από το παράθυρο διαλόγου ενός παιχνιδιού Pokémon στην ιαπωνική γλώσσα.
Η OpenAI σχεδιάζει να επεκτείνει τη διαθεσιμότητα της έκδοσης alpha της Advanced Voice σε περισσότερους συνδρομητές Plus τις επόμενες εβδομάδες και να τη διαθέσει σε όλους τους χρήστες Plus το φθινόπωρο.
Real-Time Japanese translation using #ChatGPT’s new advanced voice mode + vision alpha! Yet another useful example! pic.twitter.com/wDXrgYQkZE
— Manuel Sainsily (@ManuVision) July 31, 2024