back to top
Σάββατο, 19 Απριλίου, 2025
ΑρχικήUncategorizedΝέα δοκιμή: GPT-4.5 υπερέχει του ανθρώπου

Νέα δοκιμή: GPT-4.5 υπερέχει του ανθρώπου

- Advertisment -

Περιεχόμενα Άρθρου [hide]


Το GPT-4.5 του OpenAI υπερηφανωμένος Οι άνθρωποι σε μια πρόσφατη δοκιμασία Turing από το UC San Diego, δείχνοντας πόσο εύκολα οι άνθρωποι μπορούν να σφάλλουν το AI για πραγματική συζήτηση, συμμετέχοντας σε συνομιλίες δίπλα-δίπλα.

Η δοκιμή Turing έχει μετρήσει εδώ και αν ένα μηχάνημα μπορεί να περάσει ως άνθρωπος μέσω αλληλεπίδρασης με βάση το κείμενο. Σε αυτήν την ενημερωμένη έκδοση, σχεδόν 300 συμμετέχοντες από το εργαστήριο γλωσσών και γνώσης του UC του Σαν Ντιέγκο, ο καθένας συνομίλησε με έναν άνθρωπο και ένα AI πριν αποφασίσει αυτό.

Το GPT-4.5, εξοπλισμένο με ένα pop-culture-savvy persona, έπεισε τους συμμετέχοντες ότι ήταν ανθρώπινο 73 τοις εκατό του χρόνου-καλά πάνω από το 50 τοις εκατό αναφορά που χρησιμοποιείται ιστορικά για να καθορίσει ένα πέρασμα. Οι πραγματικοί άνθρωποι δεν ξεγελάσουν τους συμμετέχοντες τόσο συχνά.

Άλλα συστήματα περιλάμβαναν το LLAMA 3 της Meta, το GPT-4O της Meta και την Eliza, ένα από τα πρώτα chatbots. Χωρίς καθορισμένο πρόσωπο, το ποσοστό επιτυχίας της GPT-4,5 μειώθηκε στο 36 % και η GPT-4O σημείωσε μόνο 21 %.

Οι ερευνητές σημειώνουν ότι η διέλευση του τεστ Turing δεν σημαίνει ότι ένα AI καταλαβαίνει πραγματικά τη γλώσσα όπως ένα άτομο. Ακόμα, τα αποτελέσματα υπογραμμίζουν πόσο πειστικά αυτά τα μοντέλα μπορούν να μιμηθούν την ανθρώπινη συνομιλία, ειδικά όταν δοθούν συγκεκριμένοι ρόλοι. Τα ευρήματα δημοσιεύονται επί του παρόντος σε διακομιστή Preprint, με εκκρεμείς εκκρεμείς απελευθέρωσης από ομοτίμους.


Προτεινόμενη πίστωση εικόνας



VIA: DataConomy.com

- Advertisement -
- Advertisment -
Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -