Το DeepSeek λανσάρει το μοντέλο V4 με ένα εκατομμύριο Token Context


DeepSeek της Κίνας έχει ξεκινήσει Το μοντέλο τεχνητής νοημοσύνης της, DeepSeek-V4, υποστηρίζοντας ότι προσφέρει βελτιωμένες δυνατότητες σε σχέση με εναλλακτικές λύσεις ανοιχτού κώδικα. Το νέο μοντέλο είναι βελτιστοποιημένο για εγχώρια τσιπ και διαθέτει ένα εξαιρετικά μεγάλο πλαίσιο ενός εκατομμυρίου λέξεων, επιβεβαιώνοντας την ηγετική θέση στις ικανότητες των πρακτόρων, τη γνώση του κόσμου και την απόδοση συλλογισμού.

Το DeepSeek-V4 είναι διαθέσιμο σε δύο εκδόσεις: DeepSeek-V4-Pro και DeepSeek-V4-Flash. Το τελευταίο διατίθεται στο εμπόριο ως πιο αποτελεσματική και οικονομική επιλογή. Στα σημεία αναφοράς της παγκόσμιας γνώσης, το DeepSeek-V4-Pro ξεπερνά σημαντικά τα άλλα μοντέλα ανοιχτού κώδικα και ακολουθεί στενά το μοντέλο κλειστού κώδικα της Google, -Pro-3.1.

Η έκδοση DeepSeek-V4-Pro εισάγει μια «λειτουργία μέγιστης συλλογιστικής προσπάθειας», ενισχύοντας τις δυνατότητες γνώσης σε σύγκριση με τα υπάρχοντα μοντέλα ανοιχτού κώδικα. Αυτή η έκδοση ακολουθεί μια προηγούμενη ύφεση της αγοράς που προκλήθηκε από το προηγούμενο μοντέλο R1 της DeepSeek, το οποίο ουσιαστικά ανταγωνίστηκε το με χαμηλότερο κόστος.

Ενώ το συγκεκριμένο σύστημα τσιπ που χρησιμοποιείται για την εκπαίδευση των μοντέλων V4 παραμένει άγνωστο, η DeepSeek δήλωσε ότι το λογισμικό της είναι συμβατό με τα τσιπ Nvidia και Huawei. Αυτό το λανσάρισμα συμπίπτει με τους αυξανόμενους περιορισμούς στις εξαγωγές ημιαγωγών των στην Κίνα, ιδιαίτερα για GPU υψηλής τεχνολογίας που είναι ζωτικής σημασίας για την ανάπτυξη της τεχνητής νοημοσύνης.

Το νέο μοντέλο μπορεί να επεξεργαστεί μέγιστη απόδοση 384.000 token, τα οποία είναι οι θεμελιώδεις μονάδες δεδομένων για μοντέλα AI. Ένα διακριτικό τυπικά αντιπροσωπεύει περίπου τέσσερις χαρακτήρες. Έτσι, η γρήγορη επεξεργασία του μοντέλου ενισχύει την ταχύτητα εκμάθησης και απόκρισης. Το DeepSeek ισχυρίζεται ένα σημαντικό άλμα στην υπολογιστική απόδοση, ικανό να κατανοήσει το πλαίσιο έως και ενός εκατομμυρίου μάρκες.

Το DeepSeek-V4-Pro φέρεται να έχει καλύτερη απόδοση από το Gemini-3.1-Pro της Google στην επεξεργασία μεγάλων συμβολοσειρών κειμένου, αλλά εξακολουθεί να ακολουθεί το μοντέλο Claude Opus 4.6 της Anthropic. Η εταιρεία στοχεύει να βελτιώσει περαιτέρω την ευφυΐα και τη χρηστικότητα του μοντέλου σε διάφορες εφαρμογές.

Το DeepSeek έδειξε ότι αυτή η σημαντική ανακάλυψη θα εγκαινιάσει μια νέα εποχή πλαισίων εκατομμυρίων για γλωσσικά μοντέλα επόμενης γενιάς. “Αυτή η σημαντική ανακάλυψη επιτρέπει την αποτελεσματική υποστήριξη για μήκος περιβάλλοντος ενός εκατομμυρίου μάρκες”, δήλωσε η DeepSeek στην ανακοίνωσή της.


Πίστωση επιλεγμένης εικόνας





VIA: dataconomy.com

Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -

Most Popular 48hrs

- Advertisement -

Latest Articles