Το Meta χρησιμοποίησε ένα «πειραματικό» μοντέλο AI για να ανεβαίνει τα leaderboards, δημιουργώντας ερωτήσεις σχετικά με τη δικαιοσύνη, τη διαφάνεια και ό, τι πραγματικά μπορούν να χρησιμοποιήσουν οι χρήστες

9 Απριλίου, 2025

194

Περιεχόμενα Άρθρου [hide]

Η Meta Faces Backlash για τη χρήση ενός προσαρμοσμένου μοντέλου AI σε δημόσια σημεία αναφοράς, προκαλώντας κατηγορίες για παραπλανητικές αξιώσεις απόδοσης

Η Meta ξεκίνησε δύο νέες εκδόσεις του LLAMA 4 AI κατά τη διάρκεια του Σαββατοκύριακου, συμπεριλαμβανομένου ενός μικρότερου μοντέλου που ονομάζεται Scout και ενός μοντέλου μεσαίου μεγέθους που ονομάζεται Maverick. Η εταιρεία ισχυρίστηκε ότι το τελευταίο της μοντέλο ξεπέρασε το chatgpt-4o και το gemini 2.0 flash σε πολλές δημοφιλείς δοκιμές, αλλά φαίνεται ότι υπάρχει κάτι που η εταιρεία δεν είπε στους δοκιμαστές ή το έκανε;

Η Meta Faces Backlash για τη χρήση ενός προσαρμοσμένου μοντέλου AI σε δημόσια σημεία αναφοράς, προκαλώντας κατηγορίες για παραπλανητικές αξιώσεις απόδοσης

Το Maverick της Meta κέρδισε το δεύτερο σημείο στη Lmarena σύντομα μετά την εκτόξευσή του, ανεβαίνοντας στο leaderboard σε μια προσπάθεια να πάρει το θρόνο για πάντα. Ωστόσο, υπάρχουν περισσότερα για την ιστορία από ό, τι χτυπά το μάτι. Εάν δεν είστε εξοικειωμένοι με την Lmarena, είναι ένας ιστότοπος όπου οι άνθρωποι συγκρίνουν τις απαντήσεις του AI και ψηφίζουν για αυτό που βλέπουν καλύτερα με βάση τη σχετικότητα και την ακρίβεια.

Ο Meta ήταν περήφανος που ανακοινώνει ότι ο Maverick έχει ένα ELO σκορ 1417, το οποίο χτυπά τους GPT-40 και στηρίζεται λίγο πίσω από το Gemini 2.5 Pro. Φαίνεται ότι η Meta είχε δημιουργήσει ένα μοντέλο AI που ανταγωνίζεται δύο από τα καλύτερα μοντέλα της βιομηχανίας. Λοιπόν, όχι αρκετά, όπως οι άνθρωποι έσπευσαν να παρατηρήσουν ότι κάτι δεν προσθέτει σωστά. Λίγο αργότερα, ο Meta παραδέχτηκε ότι το μοντέλο που είχαν υποβάλει στη Lmarena ήταν διαφορετικό από αυτό που θα απελευθέρωσαν στο κοινό.

Αντ ‘αυτού, ο Meta υπέβαλε μια πειραματική έκδοση συνομιλίας, η οποία βελτιστοποιήθηκε και τελειοποιήθηκε για να ακούγεται καλύτερα σε συνομιλίες, σύμφωνα με Τεχνολογική. Η Lmarena απάντησε λέγοντας ότι “η ερμηνεία της πολιτικής από την Meta δεν ταιριάζει με αυτό που περιμένουμε από τους παρόχους μοντέλων”. Πρόσθεσαν επίσης ότι η Meta θα έπρεπε να ήταν πιο διαφανής σχετικά με τη χρήση της έκδοσης “LLAMA-4-MAVERICK-03-26-πειραματικής”, η οποία σχεδιάστηκε ειδικά για ανθρώπινη προτίμηση.

Σε απάντηση, η Lmarena έχει αλλάξει τις πολιτικές του για να κάνει τις μελλοντικές βαθμολογίες δίκαιες και αξιόπιστες. Εδώ είναι αυτό που είπε ο εκπρόσωπος του Meta σε απάντηση στο φιάσκο.

“Τώρα έχουμε κυκλοφορήσει την έκδοση ανοιχτού κώδικα και θα δούμε πώς οι προγραμματιστές προσαρμόζουν το Llama 4 για τις δικές τους περιπτώσεις χρήσης.”

Ενώ η εταιρεία δεν έσπασε κανόνες, δεν ήταν αρκετά σαφές. Έθεσε ανησυχίες ότι η εταιρεία παίζει το leaderboard χρησιμοποιώντας μια βελτιστοποιημένη και επάνω κλιμακωτή έκδοση του μοντέλου, η οποία δεν θα ήταν διαθέσιμη στο κοινό. Ένας ανεξάρτητος ερευνητής AI, Simon Willison, παραδέχθηκε ότι:

“Όταν βγήκε το Llama 4 και χτύπησε το #2, αυτό με εντυπωσίασε πραγματικά – και κλωτσώ τον εαυτό μου για να μην διαβάζω τη μικρή εκτύπωση.”

“Είναι μια πολύ συγκεχυμένη απελευθέρωση γενικά … η βαθμολογία μοντέλου που φτάσαμε εκεί είναι εντελώς άχρηστη για μένα. Δεν μπορώ καν να χρησιμοποιήσω το μοντέλο που πήρε ένα υψηλό σκορ”.

Από την άλλη πλευρά, υπήρχαν επίσης φήμες ότι η Meta εκπαιδεύει τα μοντέλα AI για να αποδώσει καλά σε ορισμένες δοκιμές, αλλά ο αντιπρόεδρος της εταιρείας AI, Ahman al-Dahle, αρνήθηκε τα σχόλια και δήλωσε:

“Έχουμε επίσης ακούσει ισχυρισμούς ότι εκπαιδεύσαμε σε σύνολα δοκιμών – αυτό απλά δεν είναι αλήθεια.”

Οι χρήστες αμφισβητούν επίσης την εταιρεία σχετικά με το γιατί το νέο μοντέλο Maverick AI κυκλοφόρησε την Κυριακή, στην οποία ο Mark Zuckerberg απάντησε: “Αυτό είναι όταν ήταν έτοιμο”. Ο Meta πήρε το γλυκό του χρόνο για να απελευθερώσει το LLAMA 4, αλλά δεδομένου του πόσο ισχυρό είναι ο ανταγωνισμός, είναι καιρός. Θα μοιραστούμε περισσότερες λεπτομέρειες σχετικά με το θέμα, έτσι ώστε να παρακολουθούμε.

VIA: wccftech.com

- Advertisement -

Προηγούμενο άρθρο

Διακόπτης 2 VS Switch Lite: Αξίζει η αναβάθμιση;

Επόμενο άρθρο

Mate 70 Pro+: Πρώτα στην ικανοποίηση των χρηστών στο Antutu

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

Περιεχόμενα Άρθρου [hide]

Η Meta Faces Backlash για τη χρήση ενός προσαρμοσμένου μοντέλου AI σε δημόσια σημεία αναφοράς, προκαλώντας κατηγορίες για παραπλανητικές αξιώσεις απόδοσης

ΗΠΑ: Δύσκολο στοίχημα το Made in USA- Πώς θα γυρίσει η παραγωγή –

Διαδεδομένα Microsoft Entra Lockouts που συνδέονται με την ανάπτυξη νέων χαρακτηριστικών ασφαλείας

Τουρκία: Η αυτοκινητοβιομηχανία Tofas επενδύει 256 εκατ. ευρώ σε νέο μοντέλο ελαφρού οχήματος –

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

Αρχαιολόγοι ανακάλυψαν μυστηριώδεις δομές κάτω από τις πυραμίδες της Αιγύπτου

EDITOR PICKS

Ubisoft Αντιτίθεται σε Αγωγή για το Κλείσιμο του The Crew

Κρίσιμη Ευπάθεια στα Windows Χρησιμοποιήθηκε σε Στοχευμένες Επιθέσεις Ransomware

Πενήντα Χρόνια Microsoft: Από το Altair 8800 στην Επανάσταση της Τεχνητής Νοημοσύνης

POPULAR POSTS

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

POPULAR CATEGORY

Σχετικά με το TechBit

FOLLOW US