Η NVIDIA κερδίζει τους πάντες στο DeepSeek V4 με την υποστήριξη Day-0 Blackwell, Pushing 3.500 Tokens ανά δευτερόλεπτο σε μοντέλα 1.6T


Το DeepSeek V4 κυκλοφορεί, φέρνοντας σημαντικές βελτιστοποιήσεις, συμπεριλαμβανομένων μεγεθών μοντέλων έως και 1,6 Τ, και η είναι έτοιμη με υποστήριξη Day-0 σε GPU Blackwell που χρησιμοποιούν NVFP4.

Το NVIDIA Blackwell NVFP4 Architecture προσφέρει σημαντικές επιταχύνσεις στο DeepSeek v4 με περισσότερες βελτιστοποιήσεις στο δρόμο

Με την κυκλοφορία του DeepSeek V4, είδαμε μερικές σημαντικές βελτιστοποιήσεις στις απαιτήσεις υπολογιστών και μνήμης.

Το ενημερωμένο μοντέλο τεχνητής νοημοσύνης χρησιμοποιεί μόλις το 27% των FLOP συμπερασμάτων ενός διακριτικού και το 10% της κρυφής μνήμης KV κατά την εκτέλεση ενός παραθύρου περιβάλλοντος ενός εκατομμυρίου διακριτικών. Παρουσιάστηκαν επίσης δύο νέα μοντέλα, το ένα είναι ένα μοντέλο Pro με μέγεθος παραμέτρου 1,6T και μια έκδοση Flash με μέγεθος παραμέτρου 284B.

Προσδιορισμός DeepSeek-V4-Pro DeepSeek-V4-Flash
Τυπικότης Κείμενο Κείμενο
Συνολικές παράμετροι 1,6Τ 284Β
Ενεργές παράμετροι 49Β 13Β
Μήκος περιβάλλοντος 1 εκατομμύριο μάρκες 1 εκατομμύριο μάρκες
Μέγιστο μήκος εξόδου Έως 384.000 διακριτικά μέσω των εγγράφων API του DeepSeek Έως 384.000 διακριτικά μέσω των εγγράφων API του DeepSeek
Περιπτώσεις πρωτογενούς χρήσης Προηγμένοι συλλογισμοί, κωδικοποίηση, πράκτορες μεγάλου πλαισίου Αποτελεσματικότητα υψηλής ταχύτητας, συνομιλία, δρομολόγηση, σύνοψη
Αδεια MIT Υψηλής ταχύτητας αποτελεσματικότητα, συνομιλία, δρομολόγηση και σύνοψη

Με αυτήν την κυκλοφορία, η NVIDIA επιδεικνύει την υποστήριξη Day-0 και την απόδοση των GPU Blackwell στο DeepSeek V4. Η εταιρεία δηλώνει ότι οι GPU Blackwell παρέχουν την κλίμακα και την απόδοση χαμηλής καθυστέρησης που απαιτείται για την εκτέλεση μοντέλων τεχνητής νοημοσύνης μακράς διάρκειας 1M και τρισεκατομμυρίων παραμέτρων που προσφέρει το V4.

Από την ανάπτυξη κέντρων δεδομένων στο NVIDIA Blackwell έως τις διαχειριζόμενες μικροϋπηρεσίες NIM και τις ροές εργασίας λεπτομέρειας, η NVIDIA παρέχει μια σειρά επιλογών για την ενοποίηση του DeepSeek και άλλων ανοιχτών μοντέλων σε διαφορετικά στάδια ανάπτυξης και ανάπτυξης. Η NVIDIA συνεισφέρει ενεργά στο οικοσύστημα ανοιχτού κώδικα και έχει κυκλοφορήσει αρκετές εκατοντάδες έργα με άδειες ανοιχτού κώδικα. Η NVIDIA δεσμεύεται στη βελτιστοποίηση του κοινοτικού λογισμικού και τα ανοιχτά μοντέλα επιτρέπουν στους χρήστες να μοιράζονται ευρέως την εργασία τους σε θέματα ασφάλειας και ανθεκτικότητας .

μέσω NVIDIA

Στη διαφάνεια απόδοσης, η NVIDIA επιδεικνύει απόδοση σχεδόν 3500 TPS ανά GPU (GB300 ή Blackwell Ultra) και αυτά είναι απλώς προκαταρκτικά στοιχεία που αναμένεται να αυξηθούν καθώς γίνονται περαιτέρω βελτιστοποιήσεις στη στοίβα co-design. Η στοίβα NVIDIA Blackwell προσφέρει μια σειρά από τεχνολογίες ειδικά σχεδιασμένες για μοντέλα όπως το V4, μεταξύ των οποίων NVFP4Dynamo, Βελτιστοποιημένοι πυρήνες CUDA, προηγμένες τεχνικές παραλληλοποίησης και πολλά άλλα.

Αυτό που είναι το κλειδί για το DeepSeek V4 είναι η εφαρμογή της κβαντοποίησης FP4 (MXFP4), η οποία χρησιμοποιείται για την επιτάχυνση τόσο της διάθεσης όσο και των περασμάτων συμπερασμάτων. Με το FP4 DeepSeek, τα μοντέλα V4 μειώνουν την κυκλοφορία μνήμης και τον λανθάνοντα χρόνο δειγματοληψίας.

Ένα πράγμα που πρέπει να επισημανθεί είναι ότι τα τελευταία τσιπ Ascend της , τα Ascend 950PR και Ascend 950DT, και τα δύο προγραμματισμένα για το 2026, διαθέτουν οδηγίες MXFP4. Αυτό δείχνει ότι το DeepSeek V4 θα είναι επίσης πλήρως συμβατό με τα εγχώρια τσιπ AI της Κίνας.

Με τις συνεχείς βελτιστοποιήσεις της NVIDIA, τα επερχόμενα μοντέλα θα δουν μια ισχυρή υποστήριξη οικοσυστήματος εκτός συσκευασίας.

Hassan Mujtaba Φωτογραφία

Σχετικά με τον συγγραφέα: Μηχανικός Λογισμικού με εκπαίδευση και λάτρης των Η/Υ με πάθος, ο Hassan Mujtaba υπηρετεί ως Senior Editor της Wccftech για το τμήμα υλικού. Με πολυετή εμπειρία στον κλάδο, ειδικεύεται στην τεχνική ανάλυση σε βάθος της επόμενης γενιάς αρχιτεκτονικών CPU και GPU, μητρικών πλακών και λύσεων ψύξης. Η δουλειά του περιλαμβάνει όχι μόνο έκτακτες ειδήσεις για τις επερχόμενες τεχνολογίες, αλλά και εκτενείς πρακτικές κριτικές και συγκριτική αξιολόγηση.

Ακολουθώ Wccftech στο Google για να λαμβάνετε περισσότερες από τις ειδήσεις μας στις ροές δεδομένων σας.





VIA: wccftech.com

Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -

Most Popular 48hrs

- Advertisement -

Latest Articles