Η Tencent χρησιμοποιεί την κυκλοφορία προϊόντων, όχι μόνο δείκτες αναφοράς, για να ορίσει την προεπισκόπηση Hy3


Η Tencent κυκλοφορεί την προεπισκόπηση Hy3 με τις συνήθεις αξιώσεις αναφοράς που αναμένονται για ένα νέο μοντέλο μεγάλης γλώσσας. Αλλά το πιο χαρακτηριστικό μέρος της κυκλοφορίας είναι το σημείο όπου η εταιρεία αποδεικνύει την απόδειξη: εσωτερικά προϊόντα.

Σύμφωνα με τα τελευταία ενημερωτικά υλικά της Tencent, η προεπισκόπηση του Hy3 έχει ήδη ενσωματωθεί στα Yuanbao, CodeBuddy, WorkBuddy, ima, Tencent Docs και Peacekeeper Elite πριν από την ευρύτερη δημόσια κυκλοφορία του. Αυτό έχει σημασία γιατί η αγορά της τεχνητής νοημοσύνης φτάνει σε ένα σημείο όπου οι ισχυρισμοί ακατέργαστων μοντέλων μοιάζουν όλο και περισσότερο. Σε αυτό το περιβάλλον, η απόδοση του προϊόντος μπορεί να λέει περισσότερα από έναν άλλο γύρο αποτελεσμάτων leaderboard.

Η ίδια η προεπισκόπηση Hy3 είναι σημαντική. Η Tencent το περιγράφει ως ένα μοντέλο γλώσσας fused MoE με γρήγορη και αργή σκέψη με 295 δισεκατομμύρια συνολικές παραμέτρους, 21 δισεκατομμύρια ενεργοποιημένες παραμέτρους και υποστήριξη για έως και 256K περιβάλλοντα. Η εταιρεία λέει ότι το μοντέλο έχει βελτιώσει την αποτελεσματικότητα των συμπερασμάτων κατά 40% και έχει ισχυρή απόδοση σε συλλογισμούς, ακολουθώντας οδηγίες, εκμάθηση εντός πλαισίου, κωδικοποίηση και πρακτορεία. Η Tencent αναφέρει επίσης περισσότερα από 50 σετ αξιολόγησης, συμπεριλαμβανομένων εξειδικευμένων δοκιμών όπως SWE-Bench Verified, Terminal-Bench 2.0, BrowseComp, WideSearch, FrontierScience-Olympiad και IMOAnswerBench.

Αλλά η Tencent δεν βασίζεται μόνο σε κριτήρια αναφοράς για να κάνει την υπόθεση. Στο CodeBuddy και στο WorkBuddy, η εταιρεία λέει ότι η προεπισκόπηση Hy3 μείωσε την καθυστέρηση του πρώτου διακριτικού κατά 54%, μείωσε τη διάρκεια από άκρο σε άκρο κατά 47% και βελτίωσε τα ποσοστά επιτυχίας εργασιών σε 99,99%+. Η Tencent λέει επίσης ότι το μοντέλο έχει υποστηρίξει σταθερά σύνθετες ροές εργασίας agent έως και 495 βημάτων σε περιβάλλοντα πραγματικών χρηστών, που εκτείνονται σε εργασίες όπως χειρισμός εγγράφων, ανάλυση δεδομένων, ανάκτηση γνώσης και ενορχήστρωση εργαλείων. Αυτοί οι αριθμοί δίνουν στο λανσάρισμα μια πιο συγκεκριμένη βάση από τη συνηθισμένη αφηρημένη γλώσσα αναφοράς.

Η Tencent λέει ότι το HY3 διαμορφώνεται επίσης μέσω του συν-σχεδιασμού προϊόντων και των σχολίων ανοιχτού κώδικα, καθώς η εταιρεία εργάζεται για να βελτιώσει την απόδοση του μοντέλου σε πραγματικά σενάρια πριν από την επίσημη κυκλοφορία του HY3. Ο Yao Shunyu, επικεφαλής επιστήμονας τεχνητής νοημοσύνης της Tencent, περιέγραψε την προεπισκόπηση ως το πρώτο βήμα για την ανοικοδόμηση της σειράς μοντέλων Hunyuan, με περαιτέρω κέρδη που αναμένονται από τη συνεχιζόμενη εργασία προεκπαίδευσης και ενίσχυσης-μάθησης.

Στο Yuanbao, η Tencent λέει ότι το μοντέλο έχει αναπτυχθεί από κοινού με βάση τις απαιτήσεις του προϊόντος, όπως η κατανόηση της πρόθεσης, η ποιότητα αναζήτησης, το στυλ γραφής, η συναισθηματική νοημοσύνη και ο επαγγελματισμός. Στο Peacekeeper Elite, η εταιρεία λέει ότι η προεπισκόπηση Hy3 έχει δείξει ισχυρή απόδοση σε σενάρια NPC, συμπεριλαμβανομένων τόσο των διαλόγων που βασίζονται σε πρόσωπα εκτός αγώνων όσο και των πιο ευαίσθητων στο χρόνο, ανθρώπινων αποκρίσεων κατά τη διάρκεια των αγώνων. Μαζί, αυτά τα παραδείγματα υποδηλώνουν ότι η Tencent προσπαθεί να ορίσει την πρόοδο του μοντέλου μέσω της ορατής συμπεριφοράς που αντιμετωπίζει ο χρήστης, όχι μόνο μέσω αξιολογήσεων τύπου εργαστηρίου.

Η Tencent συνδυάζει επίσης αυτό το επιχείρημα προϊόντος με σήματα τιμολόγησης και ανάπτυξης. Μέσω του TokenHub, η προεπισκόπηση του Hy3 ξεκινά από 1,2 RMB ανά εκατομμύριο διακριτικά εισόδου και 4 RMB ανά εκατομμύριο μάρκες εξόδου, με την εταιρεία να τονίζει χαμηλότερα εμπόδια ανάπτυξης για εταιρική χρήση. Αυτό βοηθά να πλαισιώσει το μοντέλο όχι μόνο ως ικανό, αλλά και ως πρακτικό να λειτουργεί σε κλίμακα.

Αυτό μπορεί να είναι το πιο σημαντικό μήνυμα πίσω από την εκτόξευση. Η προεπισκόπηση Hy3 δεν παρουσιάζεται ως μοντέλο που υπάρχει εκτός από προϊόντα. Η Tencent χρησιμοποιεί ζωντανή διάθεση προϊόντων για να υποστηρίξει ότι το μοντέλο έχει ήδη σημασία μέσα τους. Η Tencent είπε ότι οι χρήστες θα μπορούν να δοκιμάσουν το HY3 Preview μέσω μιας δωρεάν προσφοράς διακριτικών διάρκειας δύο εβδομάδων, επεκτείνοντας την έμφαση της κυκλοφορίας στις πραγματικές δοκιμές πέρα ​​από τα εσωτερικά προϊόντα.

Η προεπισκόπηση Hy3 είναι πλέον διαθέσιμη μέσω της ακόλουθης πρόσβασης (δωρεάν πρόσβαση για περιορισμένη περίοδο δύο εβδομάδων): https://openrouter.ai/tencent/hy3-preview:free



VIA: dataconomy.com

Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -

Most Popular 48hrs

- Advertisement -

Latest Articles