H Apple φέρνει την επανάσταση: Η νέα μέθοδος που θα κάνει τις έξυπνες συσκευές ακόμα πιο γρήγορες

Apple

Οι έξυπνες συσκευές μας λαμβάνουν φωνητικές εντολές, ελέγχουν τους χτύπους της καρδιάς μας, παρακολουθούν τον ύπνο μας, μεταφράζουν κείμενα, μας στέλνουν υπενθυμίσεις, τραβούν φωτογραφίες και μας επιτρέπουν να μιλάμε με την οικογένεια και τους φίλους που βρίσκονται εκατοντάδες χιλιόμετρα μακριά.

Αυτές οι δυνατότητες θα μπορούσαν να πολλαπλασιαστούν ραγδαία. Αξιοποιώντας τη σαγηνευτική δύναμη των μεγάλων γλωσσικών μοντέλων και της επεξεργασίας της φυσικής γλώσσας, έχουμε δει τεράστια πρόοδο στην επικοινωνία μεταξύ των ανθρώπων και της τεχνολογίας, στην οποία βασιζόμαστε όλο και περισσότερο στην καθημερινή μας ζωή.

Υπάρχει ένα εμπόδιο όμως όσον αφορά την τεχνητή νοημοσύνη και τις φορητές συσκευές μας. Οι ερευνητές της Apple τονίζουν ότι είναι έτοιμοι να προβούν σε μια σημαντική εφεύρεση για το μέλλον των έξυπνων συσκευών.

Η τεχνολογία των έξυπνων συσκευών στα χέρια της Apple

Το μεγάλο θέμα είναι η υπολογιστική μνήμη διότι μεγάλα γλωσσικά μοντέλα χρειάζονται τεράστια ποσότητα μνήμης. Με μοντέλα που απαιτούν αποθήκευση δυνητικά εκατοντάδων δισεκατομμυρίων παραμέτρων, τα smartphone που χρησιμοποιούνται συνήθως, όπως το iPhone 15 της Apple με ελάχιστη μνήμη 8 GB, απέχει πολύ από μια τέτοια διεργασία.

Σε ένα έγγραφο που δημοσιεύθηκε στο ηλεκτρονικό αποθετήριο ελεύθερης πρόσβασης για επιστημονικές μελέτες «arXiv», η Apple ανακοίνωσε ότι είχε αναπτύξει μια μέθοδο που χρησιμοποιεί μεταφορές δεδομένων μεταξύ μνήμης flash και DRAM που θα επιτρέψει σε μια έξυπνη συσκευή να εμπεριέχει και να εκτελεί ένα ισχυρό σύστημα AI.

Οι ερευνητές λένε ότι η διαδικασία που ανέπτυξαν μπορεί να εκτελέσει προγράμματα τεχνητής νοημοσύνης διπλάσια από τη χωρητικότητα DRAM μιας συσκευής και να επιταχύνει τις λειτουργίες της CPU έως και 500%. Οι διαδικασίες της GPU μπορούν να επιταχυνθούν έως και 25 φορές, σύμφωνα με τις τρέχουσες προσεγγίσεις.

«Η μέθοδός μας περιλαμβάνει την κατασκευή ενός μοντέλου κόστους συμπερασμάτων που εναρμονίζεται με τη συμπεριφορά της μνήμης flash, καθοδηγώντας μας στη βελτιστοποίηση σε δύο κρίσιμους τομείς. Τη μείωση του όγκου των δεδομένων που μεταφέρονται από τη flash και την ανάγνωση δεδομένων σε μεγαλύτερα, πιο συνεχόμενα κομμάτια», ανέφεραν οι ερευνητές σε έκθεση τους με τίτλο, «LLM in a flash: Efficient Large Language Model Inference with Limited Memory».

Οι δύο τεχνικές που χρησιμοποίησαν οι επιστήμονες της Apple

  • Διαίρεση της οθόνης ενός υπολογιστή σε πολλά τμήματα
  • Ομαδοποίηση στηλών σειρών

Διαίρεση της οθόνης ενός υπολογιστή σε πολλά τμήματα

Η διαίρεση αυτή μειώνει την ποσότητα των δεδομένων που πρέπει να ανταλλάσσονται μεταξύ της μνήμης flash και της μνήμης RAM. Αυτό επιτυγχάνεται με την επαναχρησιμοποίηση αποτελεσμάτων από πρόσφατους υπολογισμούς, ελαχιστοποιώντας τα αιτήματα και εξοικονομώντας ενέργεια και χρόνο.

Ομαδοποίηση στηλών σειρών

Η ομαδοποίηση αυτή επιτυγχάνει μεγαλύτερη αποτελεσματικότητα καταγράφοντας μεγαλύτερα κομμάτια δεδομένων κάθε φορά από τη μνήμη flash.

Οι δύο διαδικασίες, λένε οι ερευνητές, «συνεισφέρουν συλλογικά σε σημαντική μείωση του φορτίου δεδομένων και αύξηση της αποτελεσματικότητας της χρήσης της μνήμης». «Αυτή η ανακάλυψη είναι ιδιαίτερα σημαντική για την ανάπτυξη προηγμένων LLM σε περιβάλλοντα περιορισμένων πόρων, επεκτείνοντας έτσι τη δυνατότητα εφαρμογής και την προσβασιμότητά τους» συμπλήρωσαν.

Το HUGS και η τεχνολογία του

Σε μια άλλη πρόσφατη ανακάλυψη, η Apple ανακοίνωσε ότι είχε σχεδιάσει ένα πρόγραμμα που ονομάζεται HUGS που μπορεί να δημιουργήσει κινούμενα avatar από βίντεο αξίας λίγων μόλις δευτερολέπτων που τραβήχτηκαν από έναν μόνο φακό. Τα τρέχοντα προγράμματα δημιουργίας avatar απαιτούν πολλαπλές προβολές κάμερας. Η αναφορά, «HUGS: Human Gaussian Splats», ανέβηκε στο arXiv στις 29 Νοεμβρίου.

«Το πρόγραμμa τους μπορεί να δημιουργήσει ρεαλιστικά avatars χορού σε μόλις 30 λεπτά, πολύ μικρότερα από τις δύο ημέρες που απαιτούνται για τις τρέχουσες δημοφιλείς προσεγγίσεις» σύμφωνα με την Apple.

Scroll to Top