Πέμπτη, 15 Ιανουαρίου, 2026
ΑρχικήTechnologyΗ Tencent κυκλοφορεί το Hunyuan 2.0 με παραμέτρους 406B

Η Tencent κυκλοφορεί το Hunyuan 2.0 με παραμέτρους 406B


Η Tencent κυκλοφόρησε το Hunyuan 2.0, ένα μεγάλο μοντέλο γλώσσας με 406 δισεκατομμύρια συνολικές παραμέτρους, στις 5 Δεκεμβρίου. Αυτή η ενημέρωση στοχεύει τις εξελίξεις στα μαθηματικά, την κωδικοποίηση και τη σύνθετη λογική μέσω μιας αρχιτεκτονικής Mixture-of-Experts και εκλεπτυσμένων μεθόδων εκπαίδευσης.

Το μοντέλο διατίθεται σε δύο παραλλαγές: Think and Instruct. Η αρχιτεκτονική του ενεργοποιεί 32 δισεκατομμύρια παραμέτρους σε κάθε συμπέρασμα, επιτρέποντας την αποτελεσματική επεξεργασία. Υποστηρίζει ένα παράθυρο περιβάλλοντος 256.000 διακριτικών, επιτρέποντας το χειρισμό εκτεταμένων εισόδων χωρίς περικοπή.

Θέσεις Tencent HY 2.0 Σκεφτείτε ότι κατατάσσεται μεταξύ των «κορυφαίων εγχώριων βαθμίδων» για πολύπλοκες συλλογιστικές εργασίες. Αυτή η έκδοση ξεπερνά την προκάτοχό της, Hunyuan-T1-20250822, σε πολλούς τομείς αξιολόγησης. Στο σημείο αναφοράς μαθηματικών IMO-AnswerBench, το HY 2.0 Think κατέγραψε βαθμολογία 73,4, αντικατοπτρίζοντας ισχυρές ικανότητες επίλυσης προβλημάτων σε μαθηματικούς τομείς.

Στις αξιολογήσεις μηχανικής λογισμικού, η απόδοση βελτιώθηκε σημαντικά στο σημείο αναφοράς SWE-bench Verified, αυξάνοντας από 6,0 για το προηγούμενο μοντέλο σε 53,0. Αυτή η βελτίωση δείχνει καλύτερη ακρίβεια στη δημιουργία και τον εντοπισμό σφαλμάτων κώδικα για προκλήσεις προγραμματισμού πραγματικού κόσμου.

Η Tencent πιστώνει αυτές τις εξελίξεις σε βελτιώσεις στην ποιότητα των δεδομένων πριν από την εκπαίδευση και σε μια προσέγγιση ενισχυτικής μάθησης σε δύο στάδια. Αυτή η στρατηγική ενσωματώνει το RLVR ή την Ενισχυτική μάθηση με επαληθεύσιμες ανταμοιβές, που χρησιμοποιεί αντικειμενικές μετρήσεις για εκπαίδευση, και το RLHF ή την Ενισχυτική μάθηση από την ανθρώπινη ανατροφοδότηση, που ενσωματώνει ανθρώπινες αξιολογήσεις για να βελτιώσει τα αποτελέσματα.

Το HY 2.0 Think εφαρμόζει στρατηγικές επιβολής πέναλτι για να αποτρέψει την υπερβολική λεκτικότητα στις απαντήσεις, με αποτέλεσμα αυτό που η Tencent αποκαλεί υπολογιστική απόδοση ανά κουπόνι «κορυφαία στον κλάδο». Αυτός ο σχεδιασμός βελτιστοποιεί τη χρήση των πόρων κατά την παραγωγή, μειώνοντας τον χρόνο και το κόστος επεξεργασίας.

Οι λειτουργίες κωδικοποίησης και πράκτορας προχώρησαν επίσης, με τη βαθμολογία Tau2-Bench να σκαρφαλώνει από το 17,1 στο 72,4. Αυτές οι μετρήσεις αξιολογούν την αυτόνομη εκτέλεση εργασιών και τις αλληλεπιδράσεις που σχετίζονται με τον κώδικα.

Η ενσωμάτωση επεκτείνεται στις καταναλωτικές εφαρμογές της Tencent, όπως το Yuanbao και το ima, όπου το μοντέλο ενισχύει τις αλληλεπιδράσεις των χρηστών. Οι προγραμματιστές μπορούν να έχουν πρόσβαση σε αυτό μέσω της πλατφόρμας API της Tencent Cloud για προσαρμοσμένες υλοποιήσεις. Η Tencent σχεδιάζει να δημιουργήσει τεχνολογίες και μοντέλα ανοιχτού κώδικα για κοινοτική χρήση.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Marizas Dimitris
Marizas Dimitrishttps://techbit.gr
Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -