Το QWEN3 δείχνει ότι τα ανοιχτά μοντέλα μπορούν ακόμα να ανταγωνιστούν τους κλειστούς γίγαντες

30 Απριλίου, 2025

190

Περιεχόμενα Άρθρου [hide]

Μείνετε μπροστά από την καμπύλη!

Αλμπάμπα απελευθερωμένος Η QWEN3, μια οικογένεια μοντέλων AI που η εταιρεία ισχυρίζεται ότι ταιριάζει και μερικές φορές ξεπερνά τα καλύτερα μοντέλα της Google και της OpenAI, τη Δευτέρα. Τα μοντέλα κυμαίνονται σε μέγεθος από παραμέτρους 0,6 δισεκατομμυρίων έως 235 δισεκατομμυρίων παραμέτρων και είναι διαθέσιμα για λήψη κάτω από άδεια “Open” από την πλατφόρμα AI Dev Αγκάλιασμα και Github.

Τα μοντέλα QWEN3 περιγράφονται ως “υβριδικά” επειδή μπορούν να πάρουν χρόνο για να “λογικά” μέσω σύνθετων προβλημάτων ή να απαντήσουν σε απλούστερες αιτήσεις γρήγορα. Αυτή η ικανότητα συλλογιστικής επιτρέπει στα μοντέλα να ελέγχουν τον εαυτό τους αποτελεσματικά, παρόμοια με το μοντέλο O3 του OpenAI, αλλά με υψηλότερη λανθάνουσα κατάσταση. Σύμφωνα με την ομάδα QWEN, έχουν “άψογα ολοκληρωμένες σκέψεις και μη σκέψεις, προσφέροντας στους χρήστες την ευελιξία να ελέγχουν τον προϋπολογισμό σκέψης”.

Ορισμένα μοντέλα QWEN3 υιοθετούν ένα μείγμα αρχιτεκτονικής εμπειρογνωμόνων (MOE), η οποία μπορεί να είναι πιο υπολογιστικά αποτελεσματική για την απάντηση σε ερωτήματα. Το MOE καταρρίπτει τα καθήκοντα σε υποκείμενα και τα μεταφέρει σε μικρότερα, εξειδικευμένα μοντέλα “εμπειρογνωμόνων”. Τα μοντέλα υποστηρίζουν 119 γλώσσες και εκπαιδεύτηκαν σε ένα σύνολο δεδομένων περίπου 36 τρισεκατομμυρίων μαρκών, συμπεριλαμβανομένων των εγχειριδίων, των ζευγών ερωτήσεων-απαντήσεων, των αποσπασμάτων κώδικα και των δεδομένων που παράγονται από την AI.

Σημεία αναφοράς που μοιράζονται η Alibaba

Η Alibaba ισχυρίζεται ότι οι δυνατότητες του QWEN3 έχουν βελτιωθεί σε σύγκριση με τον προκάτοχό του, QWEN2. Το μεγαλύτερο μοντέλο QWEN3, QWEN-3-235B-A22B, εκτελεί ανταγωνιστικά στις αξιολογήσεις αναφοράς, χτυπώντας το O3-Mini του OpenAI και το Google 2,5 Pro στο CodeForces, μια πλατφόρμα για τους αγώνες προγραμματισμού. Επίσης, ξεπερνά το O3-Mini στην τελευταία έκδοση του AIME, ένα προκλητικό σημείο αναφοράς των μαθηματικών και το BFCL, μια δοκιμή για την αξιολόγηση της ικανότητας ενός μοντέλου να αιτιολογεί τα προβλήματα.

Το QWEN3 δείχνει ότι τα ανοιχτά μοντέλα μπορούν ακόμα να ανταγωνίζονται κλειστά γίγαντες_02 — Σημεία αναφοράς που μοιράζονται η Alibaba

Ενώ το QWEN-3-235B-A22B δεν είναι διαθέσιμο στο κοινό, το μεγαλύτερο δημόσιο μοντέλο QWEN3, QWEN3-32B, εξακολουθεί να είναι ανταγωνιστική με διάφορα μοντέλα ιδιόκτητων και ανοικτών AI. Το QWEN3-32B ξεπερνά το μοντέλο O1 του OpenAI σε διάφορες δοκιμές, συμπεριλαμβανομένου του κωδικοποιητικού δείκτη Benchmark LiveCodeBench. Ο Alibaba λέει ότι το QWEN3 υπερέχει στις δυνατότητες κλήσεων εργαλείων, ακολουθώντας τις οδηγίες και την αντιγραφή συγκεκριμένων μορφών δεδομένων.

Ο Tuhin Srivastava, συνιδρυτής και διευθύνων σύμβουλος της AI Cloud Host Baseten, σημείωσε ότι το QWEN3 είναι ένα άλλο παράδειγμα ανοιχτών μοντέλων που συμβαδίζουν με συστήματα κλειστού πηγής όπως το OpenAi’s. Πρόσθεσε ότι τα μοντέλα όπως το QWEN3 πιθανότατα θα χρησιμοποιηθούν στην εγχώρια αγορά, παρά τους περιορισμούς των ΗΠΑ στις πωλήσεις τσιπ στην Κίνα.

Το QWEN3 είναι διαθέσιμο για λήψη και μέσω παρόχων σύννεφων, συμπεριλαμβανομένων των πυροτεχνημάτων AI και υπερβολικών.

Προτεινόμενη πίστωση εικόνας

VIA: DataConomy.com

- Advertisement -

Προηγούμενο άρθρο

Ραντεβού από τα άγρια χαράματα

Επόμενο άρθρο

Το εγκεφαλικό επεισόδιο στους νέους δεν είναι τόσο σπάνιο

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

Το QWEN3 δείχνει ότι τα ανοιχτά μοντέλα μπορούν ακόμα να ανταγωνιστούν τους κλειστούς γίγαντες

Περιεχόμενα Άρθρου [hide]

Η Tencent και η Alibaba αρπάζουν το αποθεματικό Nvidia της eTtence στο AI Power Play

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

Αρχαιολόγοι ανακάλυψαν μυστηριώδεις δομές κάτω από τις πυραμίδες της Αιγύπτου

EDITOR PICKS

Ανακάλυψη στο Yellowstone: Καπάκι Μάγματος Αποτρέπει Έκρηξη του Υπερηφαιστείου

iPhone 17 Air: Το πιο λεπτό iPhone που είδαμε ποτέ – Διαρροή αποκαλύπτει νέα σχεδίαση

Ubisoft Αντιτίθεται σε Αγωγή για το Κλείσιμο του The Crew

POPULAR POSTS

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

POPULAR CATEGORY

Σχετικά με το TechBit

FOLLOW US

Το QWEN3 δείχνει ότι τα ανοιχτά μοντέλα μπορούν ακόμα να ανταγωνιστούν τους κλειστούς γίγαντες

Περιεχόμενα Άρθρου [hide]

Μείνετε μπροστά από την καμπύλη!

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

EDITOR PICKS

POPULAR POSTS

POPULAR CATEGORY

Σχετικά με το TechBit

FOLLOW US