Το Lovable, το οποίο είναι ένα εργαλείο κωδικοποίησης vibe, λέει ότι ο Claude 4 έχει μειώσει τα λάθη του κατά 25% και το έκανε ταχύτερα κατά 40%.
Στις 22 Μαΐου, ο Anthropic άρχισε να κυκλοφορεί δύο νέα μοντέλα: Claude Sonnet 4 και Claude Opus 4. Ενώ το Sonnet είναι διαθέσιμο για δωρεάν χρήστες, το Opus απαιτεί συνδρομή πληρωμένης και είναι σε θέση να κάνει καλύτερα από το Sonnet όταν πρόκειται για κωδικοποίηση.
Σε ένα ανάρτηση ιστολογίουΟ Anthropic επιβεβαίωσε ότι ο Claude Opus 4 σημείωσε 72,5 τοις εκατό στο Swench (Swe είναι σύντομο για το λογισμικό μηχανικής αναφοράς).
Στις δοκιμές, το Opus 4 έδωσε συνεχείς επιδόσεις σε μακροπρόθεσμες εργασίες που απαιτούν εστιασμένη προσπάθεια και χιλιάδες βήματα.
Ο Anthropic ισχυρίστηκε επίσης ότι το νεότερο μοντέλο του εργάστηκε στον κώδικα για επτά ώρες κατ ‘ευθείαν.
Η εταιρεία κωδικοποίησης Vibe Lovable, η οποία χρησιμοποιεί το CLAUDE στο εργαλείο του “Builder Web-based and Apps Builder”, έχει παρατηρήσει παρόμοιες βελτιώσεις μετά την αναβάθμιση στο Claude 4.
Σε ένα θέση Στο X, το Lovable λέει ότι έχει 25% λιγότερα σφάλματα και είναι 40% ταχύτερα συνολικά μετά την ανάπτυξη του Claude 4 τόσο για τη δημιουργία έργων όσο και για τις επεξεργασίες σε όλα τα έργα (συμπεριλαμβανομένων των παλαιών έργων).
Σε ένα χωριστή θέσηΟ αγαπητός ιδρυτής Anton Osika επιβεβαίωσε ότι το “Claude 4 μόλις σβήνει τα περισσότερα από τα σφάλματα του Lovable”, ενώ αναφέρεται συγκεκριμένα στα σφάλματα σύνταξης LLM όταν κωδικοποιεί την κωδικοποίηση.
Το Claude 4 είναι ένα καλό μοντέλο κωδικοποίησης
Ενώ η γνώμη για το Claude 4 παραμένει μικτή, έχω παρατηρήσει προσωπικά ότι το Claude 4 παράγει κώδικα με λιγότερα σφάλματα από τους Δίδυμους όταν εργάζομαι σε εφαρμογές Dart/Kotlin.
Αυτό εξαρτάται από το έργο για το έργο και το πλαίσιο, αλλά σε έργα όπου δεν απαιτείται μακρύτερο πλαίσιο, ο Claude 4 έκανε καλύτερα από τον Δίδυμο στις δοκιμές μου.
Τα μοντέλα Claude διατήρησαν πάντα τη φήμη του “Best at Coding”, αλλά υπήρξε απότομος ανταγωνισμός από την Google πρόσφατα, ο οποίος κυκλοφόρησε το Gemini 2.5 Pro με παράθυρο 1 εκατομμυρίου πλαισίων.
Σε σύγκριση με το παράθυρο 200.000 περιβάλλοντος των μοντέλων Claude 4 ή μεγαλύτερων μοντέλων, το παράθυρο 1 εκατομμυρίου πλαισίων για το Gemini 2.5 του δίνει ένα πλεονέκτημα. Αλλά δεν σημαίνει απαραίτητα το Gemini 2.5 είναι καλύτερο από το Claude 4 στην κωδικοποίηση.
Και οι δύο μπορεί να είναι εκπληκτικά λαμπρό και επίσης τρομερό ταυτόχρονα, και έρχεται επίσης στο πώς κάνετε την άμεση μηχανική.
Είναι πάντα ωραίο να αναμειγνύετε τα μοντέλα, όπως το O3 ή το Gemini για το σχεδιασμό και το Claude 4 και το Gemini για κωδικοποίηση.
VIA: bleepingcomputer.com