Λοιπόν, φαίνεται ότι η κινεζική εταιρεία Deepseek πρόκειται να ρίξει ένα άλλο μοντέλο στην αγορά πολύ σύντομα, καθώς οι λεπτομέρειες σχετικά με το επόμενο μοντέλο “Deepseek R2” έχουν εμφανιστεί στο διαδίκτυο.
Το Deepseek R2 θα μπορούσε ενδεχομένως να διαταράξει τις αγορές AI για άλλη μια φορά. Λέγεται ότι εκπαιδεύεται κυρίαρχη από τα τσιπ AI του Huawei
Το πρώτο mainstream μοντέλο του Deepseek, το R1, έδειξε στον δυτικό κόσμο ότι η Κίνα δεν είναι καθόλου πίσω όταν πρόκειται για την ανάπτυξη μοντέλων AI υψηλού επιπέδου. Η απελευθέρωση της Κίνας συγκλόνισε τη χρηματιστηριακή αγορά των ΗΠΑ στο σημείο που έχασε δισεκατομμύρια σε αποτίμηση, αλλά έδειξε επίσης ότι η ανάπτυξη μοντέλων AI δεν απαιτεί τόσο υψηλό κόστος όσο οι εταιρείες όπως η OpenAI είχαν αποκαλύψει στο κοινό. Τώρα, τα κινεζικά μέσα μαζικής ενημέρωσης έχουν άρχισε να αναφέρει Σχετικά με τις φήμες γύρω από το επόμενο μοντέλο R2 AI του Deepseek και δεν θα είναι λάθος να πούμε ότι οι δυτικές αγορές AI θα μπορούσαν να δουν μια άλλη εκπληκτική εξέλιξη που προέρχεται από την Κίνα.
Οι φημισμένες φήμες για το Deepseek R2 διαρρέουν!
-1.2t param, 78b ενεργό, υβριδικό moe
-97,3% φθηνότερο από το GPT 4O (0,07/m in, $ 0,27/m έξω)
-5.2PB Δεδομένα εκπαίδευσης. 89,7% σε C-EVAL2.0
-Το όραμα. 92,4% στο Coco
-82% χρησιμοποίηση στο Huawei Ascend 910bΜεγάλη μετατόπιση από την αλυσίδα εφοδιασμού των ΗΠΑ. pic.twitter.com/jncg0pveyu
– Deedy (@deedydas) 26 Απριλίου 2025
Πριν πάμε στις λεπτομέρειες, είναι σημαντικό να πάρουμε τις φήμες με ένα σιτάρι αλατιού, αφού η Deepseek δεν έχει ακόμη επιβεβαιώσει τα επίσημα στοιχεία για το επόμενο μοντέλο τους. Οι κινεζικές πηγές ισχυρίζονται ότι το μοντέλο R2 έχει οριστεί να υιοθετήσει μια υβριδική αρχιτεκτονική MOE (μείγμα εμπειρογνωμόνων), η οποία λέγεται ότι είναι μια προηγμένη εκδοχή της υπάρχουσας εφαρμογής MOE, πιθανώς με προχωρημένους μηχανισμούς πύλης ή συνδυασμό πυκνών στρωμάτων για τη βελτιστοποίηση του υψηλού επιπέδου φόρτου εργασίας. Με αυτήν την αρχιτεκτονική, το Deepseek R2 έχει οριστεί να διαθέτει διπλάσια από τις παραμέτρους του R1, που εισέρχεται σε 1,2 τρισεκατομμύρια.
Ακριβώς με βάση αυτό το σχήμα, το R2 λέγεται ότι ανταγωνίζεται GPT-4 Turbo και Google Gemini 2.0 Pro, αλλά αυτή δεν είναι η μόνη περιοχή όπου η Deepseek σχεδιάζει να κάνει αντίκτυπο. Η έκθεση ισχυρίζεται ότι με το Deepseek R2, το κόστος μονάδας ανά διακριτικό είναι χαμηλότερο από 97,4% σε σύγκριση με το GPT -4 -4 που εισέρχεται με token εισόδου 0,07/m $ 0,27/m. Σε σύγκριση με την τιμολόγηση του OpenAI, το μοντέλο R2 της Deepseek θα αποτελέσει συμφωνία για τις επιχειρήσεις, καθώς θα είναι το πιο οικονομικό μοντέλο εκεί έξω. Η απελευθέρωση θα μπορούσε να αποδειχθεί μια αποφασιστική στιγμή για το AI και τα οικονομικά γύρω της.
Ένα άλλο ενδιαφέρον γεγονός που αποκαλύπτεται για το Deepseek R2 είναι ότι το μοντέλο λέγεται ότι επιτυγχάνει το 82% χρήση του συμπλέγματος Ascend 910B της Huawei, με υπολογιστική ισχύ που μετράται σε 512 Petaflops στην ακρίβεια FP16, η οποία δείχνει ότι η Deepseek αποφάσισε να χρησιμοποιήσει τους πόρους του επόμενου mainstream. Γνωρίζαμε ότι η κινεζική εταιρεία AI ενδιαφέρεται έντονα για τα τσιπ AI της Huawei και με την κατάρτιση R2 με εξοπλισμό στο σπίτι, η Deepseek είχε ουσιαστικά “κάθετα ολοκληρωμένη” την αλυσίδα εφοδιασμού AI.
Είναι σημαντικό να σημειωθεί για άλλη μια φορά ότι οι εξελίξεις γύρω από το Deepseek R2 είναι κερδοσκοπικές και ότι το τελικό μοντέλο θα μπορούσε να είναι κάτι διαφορετικό. Ωστόσο, με βάση ό, τι αναφέρουν οι κινεζικές πηγές των μέσων μαζικής ενημέρωσης, η R2 μοιάζει με μια άλλη απελευθέρωση που θα εκπλήξει τις κυριότερες εταιρείες AI.
VIA: wccftech.com