Το DeepSeek V4 κυκλοφορεί, φέρνοντας σημαντικές βελτιστοποιήσεις, συμπεριλαμβανομένων μεγεθών μοντέλων έως και 1,6 Τ, και η NVIDIA είναι έτοιμη με υποστήριξη Day-0 σε GPU Blackwell που χρησιμοποιούν NVFP4.
Το NVIDIA Blackwell NVFP4 Architecture προσφέρει σημαντικές επιταχύνσεις στο DeepSeek v4 με περισσότερες βελτιστοποιήσεις στο δρόμο
Με την κυκλοφορία του DeepSeek V4, είδαμε μερικές σημαντικές βελτιστοποιήσεις στις απαιτήσεις υπολογιστών και μνήμης.
Το ενημερωμένο μοντέλο τεχνητής νοημοσύνης χρησιμοποιεί μόλις το 27% των FLOP συμπερασμάτων ενός διακριτικού και το 10% της κρυφής μνήμης KV κατά την εκτέλεση ενός παραθύρου περιβάλλοντος ενός εκατομμυρίου διακριτικών. Παρουσιάστηκαν επίσης δύο νέα μοντέλα, το ένα είναι ένα μοντέλο Pro με μέγεθος παραμέτρου 1,6T και μια έκδοση Flash με μέγεθος παραμέτρου 284B.
| Προσδιορισμός | DeepSeek-V4-Pro | DeepSeek-V4-Flash |
| Τυπικότης | Κείμενο | Κείμενο |
| Συνολικές παράμετροι | 1,6Τ | 284Β |
| Ενεργές παράμετροι | 49Β | 13Β |
| Μήκος περιβάλλοντος | 1 εκατομμύριο μάρκες | 1 εκατομμύριο μάρκες |
| Μέγιστο μήκος εξόδου | Έως 384.000 διακριτικά μέσω των εγγράφων API του DeepSeek | Έως 384.000 διακριτικά μέσω των εγγράφων API του DeepSeek |
| Περιπτώσεις πρωτογενούς χρήσης | Προηγμένοι συλλογισμοί, κωδικοποίηση, πράκτορες μεγάλου πλαισίου | Αποτελεσματικότητα υψηλής ταχύτητας, συνομιλία, δρομολόγηση, σύνοψη |
| Αδεια | MIT | Υψηλής ταχύτητας αποτελεσματικότητα, συνομιλία, δρομολόγηση και σύνοψη |
Με αυτήν την κυκλοφορία, η NVIDIA επιδεικνύει την υποστήριξη Day-0 και την απόδοση των GPU Blackwell στο DeepSeek V4. Η εταιρεία δηλώνει ότι οι GPU Blackwell παρέχουν την κλίμακα και την απόδοση χαμηλής καθυστέρησης που απαιτείται για την εκτέλεση μοντέλων τεχνητής νοημοσύνης μακράς διάρκειας 1M και τρισεκατομμυρίων παραμέτρων που προσφέρει το V4.

Από την ανάπτυξη κέντρων δεδομένων στο NVIDIA Blackwell έως τις διαχειριζόμενες μικροϋπηρεσίες NIM και τις ροές εργασίας λεπτομέρειας, η NVIDIA παρέχει μια σειρά επιλογών για την ενοποίηση του DeepSeek και άλλων ανοιχτών μοντέλων σε διαφορετικά στάδια ανάπτυξης και ανάπτυξης. Η NVIDIA συνεισφέρει ενεργά στο οικοσύστημα ανοιχτού κώδικα και έχει κυκλοφορήσει αρκετές εκατοντάδες έργα με άδειες ανοιχτού κώδικα. Η NVIDIA δεσμεύεται στη βελτιστοποίηση του κοινοτικού λογισμικού και τα ανοιχτά μοντέλα επιτρέπουν στους χρήστες να μοιράζονται ευρέως την εργασία τους σε θέματα ασφάλειας και ανθεκτικότητας AI.
Στη διαφάνεια απόδοσης, η NVIDIA επιδεικνύει απόδοση σχεδόν 3500 TPS ανά GPU (GB300 ή Blackwell Ultra) και αυτά είναι απλώς προκαταρκτικά στοιχεία που αναμένεται να αυξηθούν καθώς γίνονται περαιτέρω βελτιστοποιήσεις στη στοίβα co-design. Η στοίβα NVIDIA Blackwell προσφέρει μια σειρά από τεχνολογίες ειδικά σχεδιασμένες για μοντέλα όπως το V4, μεταξύ των οποίων NVFP4Dynamo, Βελτιστοποιημένοι πυρήνες CUDA, προηγμένες τεχνικές παραλληλοποίησης και πολλά άλλα.
Αυτό που είναι το κλειδί για το DeepSeek V4 είναι η εφαρμογή της κβαντοποίησης FP4 (MXFP4), η οποία χρησιμοποιείται για την επιτάχυνση τόσο της διάθεσης όσο και των περασμάτων συμπερασμάτων. Με το FP4 DeepSeek, τα μοντέλα V4 μειώνουν την κυκλοφορία μνήμης και τον λανθάνοντα χρόνο δειγματοληψίας.
Ένα πράγμα που πρέπει να επισημανθεί είναι ότι τα τελευταία τσιπ Ascend της Huawei, τα Ascend 950PR και Ascend 950DT, και τα δύο προγραμματισμένα για το 2026, διαθέτουν οδηγίες MXFP4. Αυτό δείχνει ότι το DeepSeek V4 θα είναι επίσης πλήρως συμβατό με τα εγχώρια τσιπ AI της Κίνας.

Με τις συνεχείς βελτιστοποιήσεις της NVIDIA, τα επερχόμενα μοντέλα θα δουν μια ισχυρή υποστήριξη οικοσυστήματος εκτός συσκευασίας.
Ακολουθώ Wccftech στο Google για να λαμβάνετε περισσότερες από τις ειδήσεις μας στις ροές δεδομένων σας.
VIA: wccftech.com



