Το DeepSeek κάνει προεπισκόπηση του νέου μοντέλου τεχνητής νοημοσύνης που «κλείνει το χάσμα» με τα μοντέλα συνόρων


Το κινεζικό εργαστήριο AI DeepSeek κυκλοφόρησε δύο εκδόσεις προεπισκόπησης του νεότερου μοντέλου μεγάλης γλώσσας, DeepSeek V4μια πολυαναμενόμενη ενημέρωση για το περσινό μοντέλο V3.2 και το συνοδευτικό μοντέλο συλλογισμού R1 που κατέστρεψε τον κόσμο της τεχνητής νοημοσύνης.

Η εταιρεία λέει ότι τόσο το DeepSeek V4 Flash όσο και το V4 Pro είναι μοντέλα με συνδυασμό ειδικών με παράθυρα περιβάλλοντος 1 εκατομμυρίου token το καθένα — αρκετά ώστε να επιτρέπεται η χρήση μεγάλων βάσεων κωδικών ή εγγράφων σε μηνύματα. Η προσέγγιση του μείγματος ειδικών περιλαμβάνει την ενεργοποίηση μόνο ενός συγκεκριμένου αριθμού παραμέτρων ανά εργασία για τη μείωση του κόστους εξαγωγής συμπερασμάτων.

Το μοντέλο Pro έχει συνολικά 1,6 τρισεκατομμύρια παραμέτρους (49 δισεκατομμύρια ενεργά), γεγονός που το καθιστά το μεγαλύτερο διαθέσιμο μοντέλο ανοιχτού βάρους, ξεπερνώντας το Kimi K 2.6 του Moonshot AI (1,1 τρισεκατομμύρια), το M1 του MiniMax (456 δισεκατομμύρια) και το διπλάσιο του DeepSeek V3.2 (671 δισεκατομμύρια). Το μικρότερο, V4 Flash έχει 284 δισεκατομμύρια παραμέτρους (13 δισεκατομμύρια ενεργές).

Η DeepSeek λέει ότι και τα δύο μοντέλα είναι πιο αποτελεσματικά και πιο αποδοτικά από το DeepSeek V3.2 λόγω αρχιτεκτονικών βελτιώσεων και έχουν σχεδόν «κλείσει το χάσμα» με τα τρέχοντα κορυφαία μοντέλα, τόσο ανοιχτά όσο και κλειστά, σε κριτήρια συλλογιστικής.

Η εταιρεία ισχυρίζεται ότι το νέο της μοντέλο V4-Pro-Max υπερτερεί των ομοτίμων ανοιχτού κώδικα σε σχέση με τα κριτήρια αξιολόγησης και ξεπερνά το GPT-5.2 και το 3.0 Pro του OpenAI σε ορισμένες εργασίες. Στην κωδικοποίηση των σημείων αναφοράς ανταγωνισμού, η DeepSeek είπε ότι η απόδοση και των δύο μοντέλων V4 είναι «συγκρίσιμη με το GPT-5.4».

Συντελεστές εικόνας:DeepSeek

Ωστόσο, τα μοντέλα φαίνεται να υστερούν ελαφρώς από τα μοντέλα αιχμής σε δοκιμές γνώσεων, ειδικά το GPT-5.4 του OpenAI και το πιο πρόσφατο Gemini 3.1 Pro της Google. Αυτή η υστέρηση υποδηλώνει μια «αναπτυξιακή τροχιά που ακολουθεί τα τελευταίας τεχνολογίας μοντέλα συνόρων κατά περίπου 3 έως 6 μήνες», έγραψε το εργαστήριο.

Τόσο το V4 Flash όσο και το V4 Pro υποστηρίζουν μόνο κείμενο, σε αντίθεση με πολλά από τα αντίστοιχα κλειστού κώδικα, τα οποία προσφέρουν υποστήριξη για την κατανόηση και τη δημιουργία ήχου, βίντεο και εικόνων.

Εκδήλωση Techcrunch

Σαν Φρανσίσκο, Καλιφόρνια
|
13-15 Οκτωβρίου 2026

Αξίζει να σημειωθεί ότι το DeepSeek V4 είναι πολύ πιο προσιτό από οποιοδήποτε μοντέλο που είναι διαθέσιμο σήμερα. Το μικρότερο μοντέλο V4 Flash κοστίζει 0,14 $ ανά εκατομμύριο διακριτικά εισόδου και 0,28 $ ανά εκατομμύριο μάρκες εξόδου, υποτιμώντας τα GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini και Haiku 4.5. Το μεγαλύτερο μοντέλο V4 Pro, εν τω μεταξύ, κοστίζει 0,145 $ ανά εκατομμύριο διακριτικά εισόδου και 3,48 $ ανά εκατομμύριο μάρκες εξόδου, υποτιμώντας επίσης τα Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 και GPT-5.4.

Η εκτόξευση έρχεται μια μέρα μετά τις ΗΠΑ κατηγορούμενος Η κλέβει την IP των αμερικανικών εργαστηρίων τεχνητής νοημοσύνης σε βιομηχανική κλίμακα χρησιμοποιώντας χιλιάδες λογαριασμούς μεσολάβησης. Η ίδια η DeepSeek έχει κατηγορηθεί από την Anthropic και την OpenAI ότι «απόσταξε», ουσιαστικά αντιγράφει, τα μοντέλα τεχνητής νοημοσύνης τους.

Όταν αγοράζετε μέσω συνδέσμων στα άρθρα μας, ενδέχεται να κερδίσουμε μια μικρή προμήθεια. Αυτό δεν επηρεάζει τη συντακτική μας ανεξαρτησία.



VIA: techcrunch.com

Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -

Most Popular 48hrs

- Advertisement -

Latest Articles