DeepSeek της Κίνας έχει ξεκινήσει Το μοντέλο τεχνητής νοημοσύνης της, DeepSeek-V4, υποστηρίζοντας ότι προσφέρει βελτιωμένες δυνατότητες σε σχέση με εναλλακτικές λύσεις ανοιχτού κώδικα. Το νέο μοντέλο είναι βελτιστοποιημένο για εγχώρια τσιπ και διαθέτει ένα εξαιρετικά μεγάλο πλαίσιο ενός εκατομμυρίου λέξεων, επιβεβαιώνοντας την ηγετική θέση στις ικανότητες των πρακτόρων, τη γνώση του κόσμου και την απόδοση συλλογισμού.
Το DeepSeek-V4 είναι διαθέσιμο σε δύο εκδόσεις: DeepSeek-V4-Pro και DeepSeek-V4-Flash. Το τελευταίο διατίθεται στο εμπόριο ως πιο αποτελεσματική και οικονομική επιλογή. Στα σημεία αναφοράς της παγκόσμιας γνώσης, το DeepSeek-V4-Pro ξεπερνά σημαντικά τα άλλα μοντέλα ανοιχτού κώδικα και ακολουθεί στενά το μοντέλο κλειστού κώδικα της Google, Gemini-Pro-3.1.
🚀 Το DeepSeek-V4 Preview είναι επίσημα ζωντανό και ανοιχτού κώδικα! Καλώς ήρθατε στην εποχή του οικονομικά αποδοτικού μήκους περιβάλλοντος 1M.
🔹 DeepSeek-V4-Pro: 1,6T σύνολο / 49B ενεργές παράμετροι. Επιδόσεις που συναγωνίζονται τα κορυφαία μοντέλα κλειστού κώδικα στον κόσμο.
🔹 DeepSeek-V4-Flash: 284B συνολικά / 13B ενεργές παράμετροι.… pic.twitter.com/n1AgwMIymu— DeepSeek (@deepseek_ai) 24 Απριλίου 2026
Η έκδοση DeepSeek-V4-Pro εισάγει μια «λειτουργία μέγιστης συλλογιστικής προσπάθειας», ενισχύοντας τις δυνατότητες γνώσης σε σύγκριση με τα υπάρχοντα μοντέλα ανοιχτού κώδικα. Αυτή η έκδοση ακολουθεί μια προηγούμενη ύφεση της αγοράς που προκλήθηκε από το προηγούμενο μοντέλο R1 της DeepSeek, το οποίο ουσιαστικά ανταγωνίστηκε το ChatGPT με χαμηλότερο κόστος.
Ενώ το συγκεκριμένο σύστημα τσιπ που χρησιμοποιείται για την εκπαίδευση των μοντέλων V4 παραμένει άγνωστο, η DeepSeek δήλωσε ότι το λογισμικό της είναι συμβατό με τα τσιπ Nvidia και Huawei. Αυτό το λανσάρισμα συμπίπτει με τους αυξανόμενους περιορισμούς στις εξαγωγές ημιαγωγών των ΗΠΑ στην Κίνα, ιδιαίτερα για GPU υψηλής τεχνολογίας που είναι ζωτικής σημασίας για την ανάπτυξη της τεχνητής νοημοσύνης.
Το νέο μοντέλο μπορεί να επεξεργαστεί μέγιστη απόδοση 384.000 token, τα οποία είναι οι θεμελιώδεις μονάδες δεδομένων για μοντέλα AI. Ένα διακριτικό τυπικά αντιπροσωπεύει περίπου τέσσερις χαρακτήρες. Έτσι, η γρήγορη επεξεργασία του μοντέλου ενισχύει την ταχύτητα εκμάθησης και απόκρισης. Το DeepSeek ισχυρίζεται ένα σημαντικό άλμα στην υπολογιστική απόδοση, ικανό να κατανοήσει το πλαίσιο έως και ενός εκατομμυρίου μάρκες.
Το DeepSeek-V4-Pro φέρεται να έχει καλύτερη απόδοση από το Gemini-3.1-Pro της Google στην επεξεργασία μεγάλων συμβολοσειρών κειμένου, αλλά εξακολουθεί να ακολουθεί το μοντέλο Claude Opus 4.6 της Anthropic. Η εταιρεία στοχεύει να βελτιώσει περαιτέρω την ευφυΐα και τη χρηστικότητα του μοντέλου σε διάφορες εφαρμογές.
Το DeepSeek έδειξε ότι αυτή η σημαντική ανακάλυψη θα εγκαινιάσει μια νέα εποχή πλαισίων εκατομμυρίων για γλωσσικά μοντέλα επόμενης γενιάς. “Αυτή η σημαντική ανακάλυψη επιτρέπει την αποτελεσματική υποστήριξη για μήκος περιβάλλοντος ενός εκατομμυρίου μάρκες”, δήλωσε η DeepSeek στην ανακοίνωσή της.
VIA: dataconomy.com


