Ο κινεζικός μονόκερος τεχνητής νοημοσύνης DeepSeek κρατά τη βιομηχανία εικασίες σχετικά με την κυκλοφορία των μοντέλων επόμενης γενιάς του, V4 και R2. Παρά τις έντονες εικασίες για πιθανή εκτόξευση κατά τη διάρκεια του επερχόμενου Σεληνιακού Νέου Έτους, η εταιρεία αρνήθηκε να σχολιάσει συγκεκριμένες ημερομηνίες.
Αντί, η εταιρεία αφήνει την έρευνά της να μιλήσει. Τις τελευταίες εβδομάδες, Το DeepSeek έχει δημοσιεύσει πολλά τεχνικά έγγραφα που περιγράφουν νέες μεθόδους για να παρακάμψετε τους τρέχοντες περιορισμούς υλικού. Με τις κυρώσεις των ΗΠΑ που περιορίζουν την πρόσβαση της Κίνας σε προηγμένες GPU της Nvidia, Η τελευταία έρευνα του DeepSeek επικεντρώνεται στην αλγοριθμική απόδοση.
Την Τρίτη, η εταιρεία παρουσίασε «Engram,“μια τεχνική μνήμης υπό όρους που έχει σχεδιαστεί για να λύνει ελλείψεις μνήμης υψηλού εύρους ζώνης GPU – ένα κρίσιμο σημείο συμφόρησης στην κλιμάκωση της τεχνητής νοημοσύνης. Αυτό ακολουθεί μια εργασία που συντάχθηκε από τον Διευθύνοντα Σύμβουλο Liang Wenfeng σχετικά με τις «υπερσυνδέσεις με πολλαπλούς περιορισμούς» (mHC), ένα πλαίσιο που στοχεύει στην εκπαίδευση μαζικών συστημάτων με πιο οικονομικά αποδοτικό τρόπο.
Οι αναλυτές πιστεύουν ότι αυτές οι καινοτομίες είναι στρατηγικές κινήσεις για τη διατήρηση της δυναμικής παρά τους αντίθετους γεωπολιτικούς ανέμους. «Το DeepSeek θέλει απλώς να αποδείξει ότι η καινοτομία υποδομής AI θα οδηγήσει στην αποτελεσματικότητα,», είπε ο Zhang Ruiwang, ένας αρχιτέκτονας πληροφοριακών συστημάτων με έδρα το Πεκίνο.
Ενώ η ημερομηνία κυκλοφορίας για τους διαδόχους των μοντέλων V3 και R1 παραμένει μυστήριο, η εταιρεία επιβεβαίωσε ότι η βασική της ομάδα παραμένει άθικτη. Ένα ενημερωμένο έγγραφο για το μοντέλο R1 σημείωσε ότι και οι 18 αρχικοί βασικοί επιστήμονες εξακολουθούν να είναι στην εταιρεία, αψηφώντας τα υψηλά ποσοστά κύκλου εργασιών της Κίνας.
VIA: DataConomy.com

