Η Meta ξεκίνησε δύο νέες εκδόσεις του LLAMA 4 AI κατά τη διάρκεια του Σαββατοκύριακου, συμπεριλαμβανομένου ενός μικρότερου μοντέλου που ονομάζεται Scout και ενός μοντέλου μεσαίου μεγέθους που ονομάζεται Maverick. Η εταιρεία ισχυρίστηκε ότι το τελευταίο της μοντέλο ξεπέρασε το chatgpt-4o και το gemini 2.0 flash σε πολλές δημοφιλείς δοκιμές, αλλά φαίνεται ότι υπάρχει κάτι που η εταιρεία δεν είπε στους δοκιμαστές ή το έκανε;
Η Meta Faces Backlash για τη χρήση ενός προσαρμοσμένου μοντέλου AI σε δημόσια σημεία αναφοράς, προκαλώντας κατηγορίες για παραπλανητικές αξιώσεις απόδοσης
Το Maverick της Meta κέρδισε το δεύτερο σημείο στη Lmarena σύντομα μετά την εκτόξευσή του, ανεβαίνοντας στο leaderboard σε μια προσπάθεια να πάρει το θρόνο για πάντα. Ωστόσο, υπάρχουν περισσότερα για την ιστορία από ό, τι χτυπά το μάτι. Εάν δεν είστε εξοικειωμένοι με την Lmarena, είναι ένας ιστότοπος όπου οι άνθρωποι συγκρίνουν τις απαντήσεις του AI και ψηφίζουν για αυτό που βλέπουν καλύτερα με βάση τη σχετικότητα και την ακρίβεια.
Ο Meta ήταν περήφανος που ανακοινώνει ότι ο Maverick έχει ένα ELO σκορ 1417, το οποίο χτυπά τους GPT-40 και στηρίζεται λίγο πίσω από το Gemini 2.5 Pro. Φαίνεται ότι η Meta είχε δημιουργήσει ένα μοντέλο AI που ανταγωνίζεται δύο από τα καλύτερα μοντέλα της βιομηχανίας. Λοιπόν, όχι αρκετά, όπως οι άνθρωποι έσπευσαν να παρατηρήσουν ότι κάτι δεν προσθέτει σωστά. Λίγο αργότερα, ο Meta παραδέχτηκε ότι το μοντέλο που είχαν υποβάλει στη Lmarena ήταν διαφορετικό από αυτό που θα απελευθέρωσαν στο κοινό.
Αντ ‘αυτού, ο Meta υπέβαλε μια πειραματική έκδοση συνομιλίας, η οποία βελτιστοποιήθηκε και τελειοποιήθηκε για να ακούγεται καλύτερα σε συνομιλίες, σύμφωνα με Τεχνολογική. Η Lmarena απάντησε λέγοντας ότι “η ερμηνεία της πολιτικής από την Meta δεν ταιριάζει με αυτό που περιμένουμε από τους παρόχους μοντέλων”. Πρόσθεσαν επίσης ότι η Meta θα έπρεπε να ήταν πιο διαφανής σχετικά με τη χρήση της έκδοσης “LLAMA-4-MAVERICK-03-26-πειραματικής”, η οποία σχεδιάστηκε ειδικά για ανθρώπινη προτίμηση.
Σε απάντηση, η Lmarena έχει αλλάξει τις πολιτικές του για να κάνει τις μελλοντικές βαθμολογίες δίκαιες και αξιόπιστες. Εδώ είναι αυτό που είπε ο εκπρόσωπος του Meta σε απάντηση στο φιάσκο.
“Τώρα έχουμε κυκλοφορήσει την έκδοση ανοιχτού κώδικα και θα δούμε πώς οι προγραμματιστές προσαρμόζουν το Llama 4 για τις δικές τους περιπτώσεις χρήσης.”
Ενώ η εταιρεία δεν έσπασε κανόνες, δεν ήταν αρκετά σαφές. Έθεσε ανησυχίες ότι η εταιρεία παίζει το leaderboard χρησιμοποιώντας μια βελτιστοποιημένη και επάνω κλιμακωτή έκδοση του μοντέλου, η οποία δεν θα ήταν διαθέσιμη στο κοινό. Ένας ανεξάρτητος ερευνητής AI, Simon Willison, παραδέχθηκε ότι:
“Όταν βγήκε το Llama 4 και χτύπησε το #2, αυτό με εντυπωσίασε πραγματικά – και κλωτσώ τον εαυτό μου για να μην διαβάζω τη μικρή εκτύπωση.”
“Είναι μια πολύ συγκεχυμένη απελευθέρωση γενικά … η βαθμολογία μοντέλου που φτάσαμε εκεί είναι εντελώς άχρηστη για μένα. Δεν μπορώ καν να χρησιμοποιήσω το μοντέλο που πήρε ένα υψηλό σκορ”.
Από την άλλη πλευρά, υπήρχαν επίσης φήμες ότι η Meta εκπαιδεύει τα μοντέλα AI για να αποδώσει καλά σε ορισμένες δοκιμές, αλλά ο αντιπρόεδρος της εταιρείας AI, Ahman al-Dahle, αρνήθηκε τα σχόλια και δήλωσε:
“Έχουμε επίσης ακούσει ισχυρισμούς ότι εκπαιδεύσαμε σε σύνολα δοκιμών – αυτό απλά δεν είναι αλήθεια.”
Οι χρήστες αμφισβητούν επίσης την εταιρεία σχετικά με το γιατί το νέο μοντέλο Maverick AI κυκλοφόρησε την Κυριακή, στην οποία ο Mark Zuckerberg απάντησε: “Αυτό είναι όταν ήταν έτοιμο”. Ο Meta πήρε το γλυκό του χρόνο για να απελευθερώσει το LLAMA 4, αλλά δεδομένου του πόσο ισχυρό είναι ο ανταγωνισμός, είναι καιρός. Θα μοιραστούμε περισσότερες λεπτομέρειες σχετικά με το θέμα, έτσι ώστε να παρακολουθούμε.
VIA: wccftech.com