Το Openai μόλις κυκλοφόρησε το GPT-4.1 και είναι γελοία καλό σε χαρτί

15 Απριλίου, 2025

196

Περιεχόμενα Άρθρου [hide]

Τι νέο υπάρχει με το GPT-4.1;

Το GPT-4.1 έχει επίσημα προσγειώθηκε Στο API OpenAI, εισάγοντας ένα τρίο μοντέλων-GPT-4.1, GPT-4.1 MINI και GPT-4.1 Nano-που ξεπερνούν τους προκατόχους τους σε σχεδόν κάθε διάσταση. Αυτά τα μοντέλα έχουν σχεδιαστεί για προγραμματιστές που χρειάζονται καλύτερες δεξιότητες κωδικοποίησης, ισχυρότερη διδασκαλία και τεράστια κατανόηση μακρού πλαισίου, μειώνουν ταυτόχρονα την καθυστέρηση και το κόστος. Το μοντέλο ναυαρχίδας υποστηρίζει τώρα έως και 1 εκατομμύριο μάρκες περιβάλλοντος και διαθέτει μια νέα αποκοπή γνώσης του Ιουνίου 2024.

Τι νέο υπάρχει με το GPT-4.1;

Η οικογένεια GPT-4.1 είναι μια άμεση αναβάθμιση έναντι των GPT-4O και GPT-4.5, προσφέροντας βελτιωμένες επιδόσεις σε σημεία αναφοράς, ενώ βελτιστοποιεί τη χρήση του προγραμματιστή πραγματικού κόσμου. Το GPT-4.1 βαθμολογεί 54,6% στο SΕπαληθευτήκαμεκαθιστώντας το ένα από τα κορυφαία μοντέλα για τις εργασίες κωδικοποίησης. Σε κλίμακα Σημείο αναφοράς MultiChallengeβλέπει μια απόλυτη βελτίωση 10,5% σε σχέση με το GPT-4O στις οδηγίες που ακολουθούν. Για μακρά καθήκοντα περιβάλλοντος, θέτει ένα νέο state-of-the-art βαθμολογία 72% στο Βίβλος Video-MME.

Τα μοντέλα είναι επίσης βελτιστοποιημένα σε όλη την καμπύλη λανθάνουσας κατάστασης. Το GPT-4.1 Mini παραδίδει σχεδόν την ίδια απόδοση με την GPT-4O, ενώ μειώνει την καθυστέρηση στο μισό και μειώνοντας το κόστος κατά 83%. Το GPT-4.1 Nano είναι το ταχύτερο και πιο προσιτό μοντέλο του OpenAI, κατασκευασμένο για ταξινόμηση και αυτόματη ολοκλήρωση εργασιών, ενώ εξακολουθεί να υποστηρίζει 1 εκατομμύριο παράθυρα συμβολικού περιβάλλοντος.

Οι δυνατότητες κωδικοποίησης κάνουν ένα άλμα

Από τη δημιουργία των διεπαφών καθαρότερου frontend έως τις ακόλουθες μορφές DIFF πιο αξιόπιστα, η GPT-4.1 αποδεικνύεται ως ένας εξαιρετικά ικανός βοηθός κωδικοποίησης. Στο επαλήθευση αναφοράς του Swench, ολοκληρώνει πάνω από το ήμισυ των εργασιών σωστά-μέχρι το 33,2% με το GPT-4O. Υποστηρίζει επίσης το GPT-4O και ακόμη και το GPT-4.5 στο σημείο αναφοράς Diff Diff του Aider, προσφέροντας στους προγραμματιστές ακριβείς επεξεργασίες σε πολλαπλές γλώσσες προγραμματισμού χωρίς να ξαναγράψουν ολόκληρα αρχεία. Για τις ανανεώσεις σε επίπεδο αρχείου, τα όρια Token Output έχουν επεκταθεί σε 32.768 μάρκες.

Στις εσωτερικές συγκρίσεις, οι ιστότοποι GPT-4.1 προτιμήθηκαν το 80% του χρόνου έναντι των εξόδων της GPT-4O. Οι εξωτερικές επεξεργασίες στον κώδικα μειώθηκαν από 9% σε μόλις 2%, αντανακλώντας την καλύτερη κατανόηση του περιβάλλοντος και τη χρήση εργαλείων.

Οι πρώτοι υιοθετητές υπογραμμίζουν τις πραγματικές νίκες

Η Windsurf ανέφερε βελτίωση 60% στα εσωτερικά σημεία αναφοράς, ενώ ο Qodo διαπίστωσε ότι η GPT-4.1 παρείχε καλύτερες προτάσεις στο 55% των αιτημάτων τραβήγματος Github. Αυτές οι βελτιώσεις μεταφράζονται άμεσα σε καλύτερη ακρίβεια αναθεώρησης κώδικα, λιγότερες περιττές προτάσεις και ταχύτερους κύκλους επανάληψης για ομάδες.

Πιο έντονη οδηγία που ακολουθεί σε σενάρια

Το GPT-4.1 εκτελεί σημαντικά καλύτερα στην αξιοπιστία της διδασκαλίας. Βαθμολογεί το 87,4% επί του IFEVAL και το 38% στο σημείο αναφοράς πολλαπλών μηνυμάτων, παρουσιάζοντας κέρδη στον χειρισμό συμπλοτικών μορφών, απορρίπτοντας τις απαγορευμένες οδηγίες και ταξινόμηση ή κατάταξη. Η αξιολόγηση της OpenAI έδειξε ότι το GPT-4.1 είναι πιο ακριβής στις σκληρές προτροπές και καλύτερα στην παρακολούθηση διδασκαλίας πολλαπλών στροφών, ένα βασικό χαρακτηριστικό για την οικοδόμηση αξιόπιστων συστημάτων συνομιλίας.

Το Blue J και ο Hex εξέτασαν και τα δύο GPT-4.1 έναντι των ειδικών καθηκόντων τομέα. Η Blue J είδε τη βελτίωση της ακρίβειας κατά 53% σε σύνθετα φορολογικά σενάρια, ενώ ο Hex ανέφερε σχεδόν διπλάσια απόδοση σε καθήκοντα SQL, μειώνοντας το εντοπισμό σφαλμάτων και βελτιώνοντας την ετοιμότητα της παραγωγής.

1 εκατομμύριο παράθυρο πλαισίου συμβόλων ορίζει ένα νέο μπαρ

Και τα τρία μοντέλα στην οικογένεια GPT-4.1 υποστηρίζουν τώρα έως και 1 εκατομμύριο μάρκες περιβάλλοντος-πάνω από 8 φορές το codebase React. Αυτό επιτρέπει ισχυρές περιπτώσεις νέας χρήσης στην ανάλυση νομικών εγγράφων, στις οικονομικές έρευνες και στις ροές εργασίας λογισμικού μακράς μορφής. Στη δοκιμή “Needle in a Haystack” του OpenAI, η GPT-4.1 ανακάλυψε αξιόπιστα το σχετικό περιεχόμενο ανεξάρτητα από το πού εμφανίστηκε στην είσοδο.

Ο δείκτης αναφοράς OpenAI-MRCR επιβεβαίωσε περαιτέρω αυτό, δοκιμάζοντας την ικανότητα του μοντέλου να διακρίνει μεταξύ των πλησιέστερων προτροπών που διασκορπίζονται σε ένα τεράστιο παράθυρο περιβάλλοντος. Στο σημείο αναφοράς GraphWalks, το οποίο περιλαμβάνει τη συλλογιστική σε όλους τους κόμβους σε ένα συνθετικό γράφημα, η GPT-4.1 σημείωσε 62%, σημαντικά μπροστά από το 42%της GPT-4O.

Η Thomson Reuters ανέφερε αύξηση 17% στην ακρίβεια αναθεώρησης του νομικού εγγράφου χρησιμοποιώντας το GPT-4.1 στο σύστημα Cocounsel, ενώ η Carlyle είδε μια βελτίωση 50% στην εξαγωγή κοκκώδους οικονομικών δεδομένων από σύνθετα αρχεία.

GPT-4.5 out-humans άνθρωποι σε νέα δοκιμή

Ταχύτερο συμπέρασμα και καλύτερη κατανόηση εικόνας

Το OpenAI έχει μειώσει το χρόνο στο πρώτο συμβολικό χρησιμοποιώντας βελτιώσεις στη στοίβα συμπερασμάτων του. Το GPT-4.1 Nano ανταποκρίνεται σε λιγότερο από πέντε δευτερόλεπτα σε προτροπές 128K-Token. Για πολυτροπικές εργασίες, το GPT-4.1 MINI παρουσιάζει ισχυρότερη κατανόηση εικόνας από το GPT-4O σε σημεία αναφοράς όπως το MMMU και το Mathvista.

Σε οπτικά σημεία αναφοράς όπως το Charxiv-reasoning και το Video-MME, η GPT-4.1 οδηγεί σταθερά, σημειώνοντας 72% στο τελευταίο χωρίς υπότιτλους. Αυτό καθιστά την κορυφαία επιλογή για την κατανόηση βίντεο και την ερμηνεία του επιστημονικού χάρτη.

Περικοπές τιμών και σχέδια μετάβασης

Και τα τρία μοντέλα GPT-4.1 είναι τώρα διαθέσιμα στο API, με σημαντική πτώση των τιμών. Το GPT-4.1 είναι 26% φθηνότερο για τα μέσα ερωτήματα σε σύγκριση με το GPT-4O. Οι εκπτώσεις προσωρινής αποθήκευσης έχουν αυξηθεί στο 75%και δεν υπάρχουν επιπλέον χρεώσεις για εισόδους μεγάλου πλαισίου. Η προεπισκόπηση GPT-4.5 θα καταργηθεί μέχρι τις 14 Ιουλίου 2025, υπέρ της πιο αποτελεσματικής οικογένειας GPT-4.1.

Η τιμολόγηση ανά 1m μάρκες για το GPT-4.1 έχει οριστεί σε $ 2 για εισροές, $ 0.50 για προσωρινή αποθήκευση εισόδου και $ 8 για έξοδο. Το GPT-4.1 Nano μειώνει αυτά στα $ 0,10, $ 0,025 και $ 0,40 αντίστοιχα-καθιστώντας την πιο προσιτή επιλογή μέχρι σήμερα.

Προτεινόμενη πίστωση εικόνας

VIA: DataConomy.com

- Advertisement -

Προηγούμενο άρθρο

Οι γλώσσες Inuit έχουν πραγματικά πολλά λόγια για το χιόνι;

Επόμενο άρθρο

3 στον αέρα Podcast S08E33: Δασμοί, Delphi Economic Forum, Minecraft και…τιμές κονσολών – Podcast

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

Το Openai μόλις κυκλοφόρησε το GPT-4.1 και είναι γελοία καλό σε χαρτί

Περιεχόμενα Άρθρου [hide]

Τι νέο υπάρχει με το GPT-4.1;

Οι δυνατότητες κωδικοποίησης κάνουν ένα άλμα

Οι πρώτοι υιοθετητές υπογραμμίζουν τις πραγματικές νίκες

Πιο έντονη οδηγία που ακολουθεί σε σενάρια

1 εκατομμύριο παράθυρο πλαισίου συμβόλων ορίζει ένα νέο μπαρ

Ταχύτερο συμπέρασμα και καλύτερη κατανόηση εικόνας

Περικοπές τιμών και σχέδια μετάβασης

Δικαστής Κανόνες Η Google κατέχει παράνομο μονοπώλιο διαφήμισης

OpenAi Λεπτομέρειες chatgpt-o3, o4-mini, o4-mini-υψηλό όριο χρήσης

Ο δρομέας ήταν στο ραντάρ του OpenAi πριν από το Windsurf

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

Αρχαιολόγοι ανακάλυψαν μυστηριώδεις δομές κάτω από τις πυραμίδες της Αιγύπτου

EDITOR PICKS

Ubisoft Αντιτίθεται σε Αγωγή για το Κλείσιμο του The Crew

Κρίσιμη Ευπάθεια στα Windows Χρησιμοποιήθηκε σε Στοχευμένες Επιθέσεις Ransomware

Πενήντα Χρόνια Microsoft: Από το Altair 8800 στην Επανάσταση της Τεχνητής Νοημοσύνης

POPULAR POSTS

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

POPULAR CATEGORY

Σχετικά με το TechBit

FOLLOW US

Το Openai μόλις κυκλοφόρησε το GPT-4.1 και είναι γελοία καλό σε χαρτί

Περιεχόμενα Άρθρου [hide]

Τι νέο υπάρχει με το GPT-4.1;

Μείνετε μπροστά από την καμπύλη!

Οι δυνατότητες κωδικοποίησης κάνουν ένα άλμα

Οι πρώτοι υιοθετητές υπογραμμίζουν τις πραγματικές νίκες

Πιο έντονη οδηγία που ακολουθεί σε σενάρια

1 εκατομμύριο παράθυρο πλαισίου συμβόλων ορίζει ένα νέο μπαρ

Ταχύτερο συμπέρασμα και καλύτερη κατανόηση εικόνας

Περικοπές τιμών και σχέδια μετάβασης

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

EDITOR PICKS

POPULAR POSTS

POPULAR CATEGORY

Σχετικά με το TechBit

FOLLOW US