back to top
Σάββατο, 19 Απριλίου, 2025
ΑρχικήInternetSecurityChatgpt 4.1 Πρώιμα σημεία αναφοράς σε σύγκριση με το Google Gemini

Chatgpt 4.1 Πρώιμα σημεία αναφοράς σε σύγκριση με το Google Gemini

- Advertisment -


Το Chatgpt 4.1 τώρα κυκλοφορεί και είναι ένα σημαντικό άλμα από το GPT 4O, αλλά αποτυγχάνει να νικήσει το δείκτη αναφοράς που έχει ορίσει ο Google Gemini.

Χθες, Openai επιβεβαιωμένος Ότι οι προγραμματιστές με API Access μπορούν να δοκιμάσουν έως και τρία νέα μοντέλα: GPT -4.1, GPT -4.1 MINI και GPT -4.1 Nano.

Σύμφωνα με τα σημεία αναφοράς, αυτά τα μοντέλα είναι πολύ καλύτερα από τα υπάρχοντα Mini GPT -4O και GPT -4O, ιδιαίτερα στην κωδικοποίηση.

Για παράδειγμα, η GPT-4.1 βαθμολογεί 54,6% στην επαλήθευση του SweCH, το οποίο είναι καλύτερο από το GPT-4O κατά 21,4% και 26,6% έναντι της GPT-4,5. Έχουμε παρόμοια αποτελέσματα σε άλλα εργαλεία συγκριτικής αξιολόγησης που μοιράζονται η OpenAI, αλλά πώς ανταγωνίζεται τα μοντέλα Gemini.

Chatgpt 4.1 Πρώιμα σημεία αναφοράς

GPT 4.1
Σημεία αναφοράς που συγκρίνουν το LLMS

Σύμφωνα με τα σημεία αναφοράς κοινόχρηστος Με το StageHand, το οποίο είναι ένα πλαίσιο αυτοματοποίησης του προγράμματος περιήγησης που είναι έτοιμο για παραγωγή, το Gemini 2.0 Flash έχει το χαμηλότερο ποσοστό σφάλματος (6,67%) μαζί με την υψηλότερη βαθμολογία ακριβούς αντιστοίχισης (90%) και είναι επίσης φθηνό και γρήγορο.

Από την άλλη πλευρά, το GPT -4.1 έχει υψηλότερο ποσοστό σφάλματος (16,67%) και κοστίζει πάνω από 10 φορές περισσότερο από το Flash Gemini 2.0.

Άλλες παραλλαγές GPT (όπως “Nano” ή “Mini”) είναι φθηνότερες ή ταχύτερες αλλά όχι τόσο ακριβείς όσο το GPT-4.1

GPT4,1
Το διάγραμμα συγκρίνει το LLMS, σχεδιάζοντας την απόδοσή τους (στον κατακόρυφο άξονα) έναντι της τιμής τους ανά εκατομμύριο μάρκες (στον οριζόντιο άξονα)

Σε άλλα δεδομένα κοινόχρηστος από τον Pierre Bongrand, ο οποίος είναι επιστήμονας που εργάζεται στο RNA στο Harward, το GPT-4.1 προσφέρει φτωχότερη απόδοση κόστους-αποτελεσματικότητας από τα ανταγωνιστικά μοντέλα.

Αυτός είναι ένας σημαντικός παράγοντας επειδή το GPT4.1 είναι φθηνότερο από το ChatGpt 4O.

Μοντέλα όπως το Gemini 2.0 Flash, το Gemini 2.5 Pro, ακόμα και το Deepseek ή το O3 Mini βρίσκονται πιο κοντά ή στα σύνορα, γεγονός που υποδηλώνει ότι αποδίδουν υψηλότερες επιδόσεις με χαμηλότερο ή συγκρίσιμο κόστος.

Τελικά, ενώ το GPT -4.1 εξακολουθεί να λειτουργεί ως επιλογή, είναι σαφώς επισκιασμένη από φθηνότερες ή πιο ικανές εναλλακτικές λύσεις.

Τα σημεία αναφοράς κωδικοποίησης δείχνουν ότι το GPT-4.1 καθυστερεί πίσω από το Gemini 2.5

GPT 4.1

Βλέπουμε παρόμοια αποτελέσματα σε σημεία αναφοράς κωδικοποίησης, με Πολυγλωσσικός βοηθός Η καταχώριση GPT-4.1 με βαθμολογία 52%, ενώ το Gemini 2,5 είναι μίλια μπροστά στο 73%.

Δίδυμος 2.5

Είναι επίσης σημαντικό να σημειωθεί ότι το GPT-4.1 είναι ένα μη-συγκλονιστικό μοντέλο και εξακολουθεί να είναι ένα από τα καλύτερα μοντέλα κωδικοποίησης.

Το GPT-4.1 είναι διαθέσιμο μέσω API, αλλά μπορείτε να το χρησιμοποιήσετε δωρεάν εάν εγγραφείτε Windsurf AI.



VIA: bleepingcomputer.com

- Advertisement -
- Advertisment -
Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -