back to top
Σάββατο, 19 Απριλίου, 2025
ΑρχικήEconomyΤο Openai μόλις κυκλοφόρησε το GPT-4.1 και είναι γελοία καλό σε χαρτί

Το Openai μόλις κυκλοφόρησε το GPT-4.1 και είναι γελοία καλό σε χαρτί

- Advertisment -


Το GPT-4.1 έχει επίσημα προσγειώθηκε Στο API OpenAI, εισάγοντας ένα τρίο μοντέλων-GPT-4.1, GPT-4.1 MINI και GPT-4.1 Nano-που ξεπερνούν τους προκατόχους τους σε σχεδόν κάθε διάσταση. Αυτά τα μοντέλα έχουν σχεδιαστεί για προγραμματιστές που χρειάζονται καλύτερες δεξιότητες κωδικοποίησης, ισχυρότερη διδασκαλία και τεράστια κατανόηση μακρού πλαισίου, μειώνουν ταυτόχρονα την καθυστέρηση και το κόστος. Το μοντέλο ναυαρχίδας υποστηρίζει τώρα έως και 1 εκατομμύριο μάρκες περιβάλλοντος και διαθέτει μια νέα αποκοπή γνώσης του Ιουνίου 2024.

Τι νέο υπάρχει με το GPT-4.1;

Η οικογένεια GPT-4.1 είναι μια άμεση αναβάθμιση έναντι των GPT-4O και GPT-4.5, προσφέροντας βελτιωμένες επιδόσεις σε σημεία αναφοράς, ενώ βελτιστοποιεί τη χρήση του προγραμματιστή πραγματικού κόσμου. Το GPT-4.1 βαθμολογεί 54,6% στο SΕπαληθευτήκαμεκαθιστώντας το ένα από τα κορυφαία μοντέλα για τις εργασίες κωδικοποίησης. Σε κλίμακα Σημείο αναφοράς MultiChallengeβλέπει μια απόλυτη βελτίωση 10,5% σε σχέση με το GPT-4O στις οδηγίες που ακολουθούν. Για μακρά καθήκοντα περιβάλλοντος, θέτει ένα νέο state-of-the-art βαθμολογία 72% στο Βίβλος Video-MME.

Τα μοντέλα είναι επίσης βελτιστοποιημένα σε όλη την καμπύλη λανθάνουσας κατάστασης. Το GPT-4.1 Mini παραδίδει σχεδόν την ίδια απόδοση με την GPT-4O, ενώ μειώνει την καθυστέρηση στο μισό και μειώνοντας το κόστος κατά 83%. Το GPT-4.1 Nano είναι το ταχύτερο και πιο προσιτό μοντέλο του OpenAI, κατασκευασμένο για ταξινόμηση και αυτόματη ολοκλήρωση εργασιών, ενώ εξακολουθεί να υποστηρίζει 1 εκατομμύριο παράθυρα συμβολικού περιβάλλοντος.

Οι δυνατότητες κωδικοποίησης κάνουν ένα άλμα

Από τη δημιουργία των διεπαφών καθαρότερου frontend έως τις ακόλουθες μορφές DIFF πιο αξιόπιστα, η GPT-4.1 αποδεικνύεται ως ένας εξαιρετικά ικανός βοηθός κωδικοποίησης. Στο επαλήθευση αναφοράς του Swench, ολοκληρώνει πάνω από το ήμισυ των εργασιών σωστά-μέχρι το 33,2% με το GPT-4O. Υποστηρίζει επίσης το GPT-4O και ακόμη και το GPT-4.5 στο σημείο αναφοράς Diff Diff του Aider, προσφέροντας στους προγραμματιστές ακριβείς επεξεργασίες σε πολλαπλές γλώσσες προγραμματισμού χωρίς να ξαναγράψουν ολόκληρα αρχεία. Για τις ανανεώσεις σε επίπεδο αρχείου, τα όρια Token Output έχουν επεκταθεί σε 32.768 μάρκες.

Στις εσωτερικές συγκρίσεις, οι ιστότοποι GPT-4.1 προτιμήθηκαν το 80% του χρόνου έναντι των εξόδων της GPT-4O. Οι εξωτερικές επεξεργασίες στον κώδικα μειώθηκαν από 9% σε μόλις 2%, αντανακλώντας την καλύτερη κατανόηση του περιβάλλοντος και τη χρήση εργαλείων.

Οι πρώτοι υιοθετητές υπογραμμίζουν τις πραγματικές νίκες

Η Windsurf ανέφερε βελτίωση 60% στα εσωτερικά σημεία αναφοράς, ενώ ο Qodo διαπίστωσε ότι η GPT-4.1 παρείχε καλύτερες προτάσεις στο 55% των αιτημάτων τραβήγματος Github. Αυτές οι βελτιώσεις μεταφράζονται άμεσα σε καλύτερη ακρίβεια αναθεώρησης κώδικα, λιγότερες περιττές προτάσεις και ταχύτερους κύκλους επανάληψης για ομάδες.

Πιο έντονη οδηγία που ακολουθεί σε σενάρια

Το GPT-4.1 εκτελεί σημαντικά καλύτερα στην αξιοπιστία της διδασκαλίας. Βαθμολογεί το 87,4% επί του IFEVAL και το 38% στο σημείο αναφοράς πολλαπλών μηνυμάτων, παρουσιάζοντας κέρδη στον χειρισμό συμπλοτικών μορφών, απορρίπτοντας τις απαγορευμένες οδηγίες και ταξινόμηση ή κατάταξη. Η αξιολόγηση της OpenAI έδειξε ότι το GPT-4.1 είναι πιο ακριβής στις σκληρές προτροπές και καλύτερα στην παρακολούθηση διδασκαλίας πολλαπλών στροφών, ένα βασικό χαρακτηριστικό για την οικοδόμηση αξιόπιστων συστημάτων συνομιλίας.

Το Blue J και ο Hex εξέτασαν και τα δύο GPT-4.1 έναντι των ειδικών καθηκόντων τομέα. Η Blue J είδε τη βελτίωση της ακρίβειας κατά 53% σε σύνθετα φορολογικά σενάρια, ενώ ο Hex ανέφερε σχεδόν διπλάσια απόδοση σε καθήκοντα SQL, μειώνοντας το εντοπισμό σφαλμάτων και βελτιώνοντας την ετοιμότητα της παραγωγής.

1 εκατομμύριο παράθυρο πλαισίου συμβόλων ορίζει ένα νέο μπαρ

Και τα τρία μοντέλα στην οικογένεια GPT-4.1 υποστηρίζουν τώρα έως και 1 εκατομμύριο μάρκες περιβάλλοντος-πάνω από 8 φορές το codebase React. Αυτό επιτρέπει ισχυρές περιπτώσεις νέας χρήσης στην ανάλυση νομικών εγγράφων, στις οικονομικές έρευνες και στις ροές εργασίας λογισμικού μακράς μορφής. Στη δοκιμή “Needle in a Haystack” του OpenAI, η GPT-4.1 ανακάλυψε αξιόπιστα το σχετικό περιεχόμενο ανεξάρτητα από το πού εμφανίστηκε στην είσοδο.

Ο δείκτης αναφοράς OpenAI-MRCR επιβεβαίωσε περαιτέρω αυτό, δοκιμάζοντας την ικανότητα του μοντέλου να διακρίνει μεταξύ των πλησιέστερων προτροπών που διασκορπίζονται σε ένα τεράστιο παράθυρο περιβάλλοντος. Στο σημείο αναφοράς GraphWalks, το οποίο περιλαμβάνει τη συλλογιστική σε όλους τους κόμβους σε ένα συνθετικό γράφημα, η GPT-4.1 σημείωσε 62%, σημαντικά μπροστά από το 42%της GPT-4O.

Η Thomson Reuters ανέφερε αύξηση 17% στην ακρίβεια αναθεώρησης του νομικού εγγράφου χρησιμοποιώντας το GPT-4.1 στο σύστημα Cocounsel, ενώ η Carlyle είδε μια βελτίωση 50% στην εξαγωγή κοκκώδους οικονομικών δεδομένων από σύνθετα αρχεία.


GPT-4.5 out-humans άνθρωποι σε νέα δοκιμή


Ταχύτερο συμπέρασμα και καλύτερη κατανόηση εικόνας

Το OpenAI έχει μειώσει το χρόνο στο πρώτο συμβολικό χρησιμοποιώντας βελτιώσεις στη στοίβα συμπερασμάτων του. Το GPT-4.1 Nano ανταποκρίνεται σε λιγότερο από πέντε δευτερόλεπτα σε προτροπές 128K-Token. Για πολυτροπικές εργασίες, το GPT-4.1 MINI παρουσιάζει ισχυρότερη κατανόηση εικόνας από το GPT-4O σε σημεία αναφοράς όπως το MMMU και το Mathvista.

Σε οπτικά σημεία αναφοράς όπως το Charxiv-reasoning και το Video-MME, η GPT-4.1 οδηγεί σταθερά, σημειώνοντας 72% στο τελευταίο χωρίς υπότιτλους. Αυτό καθιστά την κορυφαία επιλογή για την κατανόηση βίντεο και την ερμηνεία του επιστημονικού χάρτη.

Περικοπές τιμών και σχέδια μετάβασης

Και τα τρία μοντέλα GPT-4.1 είναι τώρα διαθέσιμα στο API, με σημαντική πτώση των τιμών. Το GPT-4.1 είναι 26% φθηνότερο για τα μέσα ερωτήματα σε σύγκριση με το GPT-4O. Οι εκπτώσεις προσωρινής αποθήκευσης έχουν αυξηθεί στο 75%και δεν υπάρχουν επιπλέον χρεώσεις για εισόδους μεγάλου πλαισίου. Η προεπισκόπηση GPT-4.5 θα καταργηθεί μέχρι τις 14 Ιουλίου 2025, υπέρ της πιο αποτελεσματικής οικογένειας GPT-4.1.

Η τιμολόγηση ανά 1m μάρκες για το GPT-4.1 έχει οριστεί σε $ 2 για εισροές, $ 0.50 για προσωρινή αποθήκευση εισόδου και $ 8 για έξοδο. Το GPT-4.1 Nano μειώνει αυτά στα $ 0,10, $ 0,025 και $ 0,40 αντίστοιχα-καθιστώντας την πιο προσιτή επιλογή μέχρι σήμερα.


Προτεινόμενη πίστωση εικόνας



VIA: DataConomy.com

- Advertisement -
- Advertisment -
Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -