Αλμπάμπα απελευθερωμένος Η QWEN3, μια οικογένεια μοντέλων AI που η εταιρεία ισχυρίζεται ότι ταιριάζει και μερικές φορές ξεπερνά τα καλύτερα μοντέλα της Google και της OpenAI, τη Δευτέρα. Τα μοντέλα κυμαίνονται σε μέγεθος από παραμέτρους 0,6 δισεκατομμυρίων έως 235 δισεκατομμυρίων παραμέτρων και είναι διαθέσιμα για λήψη κάτω από άδεια “Open” από την πλατφόρμα AI Dev Αγκάλιασμα και Github.
Τα μοντέλα QWEN3 περιγράφονται ως “υβριδικά” επειδή μπορούν να πάρουν χρόνο για να “λογικά” μέσω σύνθετων προβλημάτων ή να απαντήσουν σε απλούστερες αιτήσεις γρήγορα. Αυτή η ικανότητα συλλογιστικής επιτρέπει στα μοντέλα να ελέγχουν τον εαυτό τους αποτελεσματικά, παρόμοια με το μοντέλο O3 του OpenAI, αλλά με υψηλότερη λανθάνουσα κατάσταση. Σύμφωνα με την ομάδα QWEN, έχουν “άψογα ολοκληρωμένες σκέψεις και μη σκέψεις, προσφέροντας στους χρήστες την ευελιξία να ελέγχουν τον προϋπολογισμό σκέψης”.
Ορισμένα μοντέλα QWEN3 υιοθετούν ένα μείγμα αρχιτεκτονικής εμπειρογνωμόνων (MOE), η οποία μπορεί να είναι πιο υπολογιστικά αποτελεσματική για την απάντηση σε ερωτήματα. Το MOE καταρρίπτει τα καθήκοντα σε υποκείμενα και τα μεταφέρει σε μικρότερα, εξειδικευμένα μοντέλα “εμπειρογνωμόνων”. Τα μοντέλα υποστηρίζουν 119 γλώσσες και εκπαιδεύτηκαν σε ένα σύνολο δεδομένων περίπου 36 τρισεκατομμυρίων μαρκών, συμπεριλαμβανομένων των εγχειριδίων, των ζευγών ερωτήσεων-απαντήσεων, των αποσπασμάτων κώδικα και των δεδομένων που παράγονται από την AI.
Η Alibaba ισχυρίζεται ότι οι δυνατότητες του QWEN3 έχουν βελτιωθεί σε σύγκριση με τον προκάτοχό του, QWEN2. Το μεγαλύτερο μοντέλο QWEN3, QWEN-3-235B-A22B, εκτελεί ανταγωνιστικά στις αξιολογήσεις αναφοράς, χτυπώντας το O3-Mini του OpenAI και το Google 2,5 Pro στο CodeForces, μια πλατφόρμα για τους αγώνες προγραμματισμού. Επίσης, ξεπερνά το O3-Mini στην τελευταία έκδοση του AIME, ένα προκλητικό σημείο αναφοράς των μαθηματικών και το BFCL, μια δοκιμή για την αξιολόγηση της ικανότητας ενός μοντέλου να αιτιολογεί τα προβλήματα.
Ενώ το QWEN-3-235B-A22B δεν είναι διαθέσιμο στο κοινό, το μεγαλύτερο δημόσιο μοντέλο QWEN3, QWEN3-32B, εξακολουθεί να είναι ανταγωνιστική με διάφορα μοντέλα ιδιόκτητων και ανοικτών AI. Το QWEN3-32B ξεπερνά το μοντέλο O1 του OpenAI σε διάφορες δοκιμές, συμπεριλαμβανομένου του κωδικοποιητικού δείκτη Benchmark LiveCodeBench. Ο Alibaba λέει ότι το QWEN3 υπερέχει στις δυνατότητες κλήσεων εργαλείων, ακολουθώντας τις οδηγίες και την αντιγραφή συγκεκριμένων μορφών δεδομένων.
Ο Tuhin Srivastava, συνιδρυτής και διευθύνων σύμβουλος της AI Cloud Host Baseten, σημείωσε ότι το QWEN3 είναι ένα άλλο παράδειγμα ανοιχτών μοντέλων που συμβαδίζουν με συστήματα κλειστού πηγής όπως το OpenAi’s. Πρόσθεσε ότι τα μοντέλα όπως το QWEN3 πιθανότατα θα χρησιμοποιηθούν στην εγχώρια αγορά, παρά τους περιορισμούς των ΗΠΑ στις πωλήσεις τσιπ στην Κίνα.
Το QWEN3 είναι διαθέσιμο για λήψη και μέσω παρόχων σύννεφων, συμπεριλαμβανομένων των πυροτεχνημάτων AI και υπερβολικών.
VIA: DataConomy.com