Νέος αντίπαλος για το DeepSeek: Το «QwQ-32b» της Alibaba μπορεί να απειλήσει το μέλλον των AI μοντέλων

QwQ-32b

Η Alibaba μόλις παρουσίασε το νέο της μοντέλο σκέψης και φαίνεται πως το DeepSeek και η OpenAI μπορεί να έχουν κάτι να ανησυχούν – τουλάχιστον αν οι υποσχέσεις της Alibaba αποδειχτούν αληθινές.

Το νέο μοντέλο, που ονομάζεται «QwQ-32b» (Quan-with-Questions), διαθέτει πολύ λιγότερες παραμέτρους, κάτι που σημαίνει ότι απαιτεί λιγότερους πόρους, αλλά η Alibaba ισχυρίζεται ότι αποδίδει στο ίδιο επίπεδο με το DeepSeek ή το o1-mini της OpenAI.

Το DeepSeek και οι υποσχέσεις της Alibaba

Το μοντέλο «DeepSeek R1» έγινε πολύ δημοφιλές τον Φεβρουάριο, όταν κυκλοφόρησε και κατάφερε ξαφνικά να ανταγωνιστεί τα χρυσά πρότυπα που έχουν θέσει το ChatGPT και άλλες εναλλακτικές λύσεις, με πολύ χαμηλότερο κόστος. Φαίνεται όμως ότι η Alibaba ίσως σπρώχνει τα όρια ακόμα πιο μακριά.

Η διαφορά στην υπολογιστική ικανότητα

Όπως εξηγεί το VentureBeat, το «DeepSeek-R1» απαιτεί 671 δισεκατομμύρια παραμέτρους για να λειτουργήσει, από τις οποίες οι 37 δισεκατομμύρια ενεργοποιούνται.

Αντίθετα, το νέο «QwQ-32b» της Alibaba μπορεί να λειτουργήσει με μόλις 32 δισεκατομμύρια παραμέτρους. Αυτοί οι αριθμοί ίσως να φαίνονται ασαφείς για πολλούς, αλλά υπάρχει τεράστια διαφορά στην υπολογιστική ισχύ. Ενώ το «DeepSeek R1» απαιτεί 1600GB VRAM για να τρέξει, το «QwQ-32b» μπορεί να λειτουργήσει με μόλις 24GB VRAM.

Σε πολλές περιπτώσεις, αυτό σημαίνει ότι χρειάζεσαι την Nvidia H100 ή ισοδύναμα μοντέλα, αλλά ακόμα και η gaming RTX 4090 διαθέτει 24GB VRAM. Η τελευταία RTX 5090 ανεβάζει αυτόν τον αριθμό στα 32GB.

Η άδεια Apache 2.0 και η χρήση από ερευνητές και εταιρείες

Το «QwQ-32b» της Alibaba είναι διαθέσιμο με άδεια «Apache 2.0», που σημαίνει ότι εταιρείες και ερευνητές μπορούν να το χρησιμοποιήσουν.

Πιο σημαντικό όμως, είναι ότι μπορούμε να το δοκιμάσουμε και εμείς μέσω της υπηρεσίας «Alibaba Qwen Chat». Όπως το «DeepSeek», το «QwQ-32b» έχει κάποιους περιορισμούς.

Αναλυτικές απαντήσεις με περιττό περιεχόμενο

Φαίνεται να δίνει αρκετά αναλυτικές απαντήσεις ακόμα και σε γρήγορες, απλές ερωτήσεις. Αυτό μπορεί να είναι καλό, αλλά με κάποιον τρόπο είναι κυρίως εκνευριστικό, καθώς παρέχει πολλή περιττή πληροφορία που δεν ζητήθηκε.

Δείχνει όλη τη διαδικασία σκέψης του, κάτι που μοιάζει με τη λειτουργία «Deep Thinking» του ChatGPT – αλλά με πολύ λιγότερο βάθος.

Περιορισμοί σε πολιτικά θέματα

Όταν ρωτήθηκε για πολιτικά θέματα, το «Qwen Chat» το σημείωσε ως ακατάλληλο. Ίσως υπάρχουν τρόποι να το «σπάσεις» – αυτό ήταν εφικτό και με το «DeepSeek».

Η ανάδυση ενός νέου αντιπάλου

Αν οι υποσχέσεις της Alibaba αποδειχτούν αληθινές, φαίνεται πως το «ChatGPT» και το «DeepSeek» τώρα έχουν έναν νέο αντίπαλο.

Scroll to Top