back to top
Κυριακή, 20 Απριλίου, 2025
ΑρχικήUncategorizedΤο OpenAI εκπαίδευσε το AI με κλεμμένα βιβλία

Το OpenAI εκπαίδευσε το AI με κλεμμένα βιβλία

- Advertisment -

Περιεχόμενα Άρθρου [hide]


Η OpenAI αντιμετωπίζει κατηγορίες για την κατάρτιση των μοντέλων του AI σε υλικό που προστατεύεται από πνευματικά δικαιώματα χωρίς άδεια, ως νέο χαρτί Ισχυρίζεται ότι η εταιρεία χρησιμοποίησε βιβλία paywalled από την O’Reilly Media για να εκπαιδεύσει το μοντέλο GPT-4O. Το έργο AI Awlosures, ένα μη κερδοσκοπικό ίδρυμα που ιδρύθηκε από τον Tim O’Reilly και τον Ilan Strauss, δημοσίευσε το έγγραφο.

Τα μοντέλα AI λειτουργούν ως κινητήρες πρόβλεψης, μαθησιακά πρότυπα από εκτεταμένα δεδομένα όπως βιβλία και ταινίες για να προβάλλουν από τις προτροπές. Ενώ ορισμένα εργαστήρια AI χρησιμοποιούν δεδομένα που παράγονται από AI, καθώς οι πηγές πραγματικού κόσμου μειώνονται, η κατάρτιση σε καθαρά συνθετικά δεδομένα μεταφέρει κινδύνους, όπως η επίδραση της απόδοσης ενός μοντέλου.

Η μεθοδολογία του χαρτιού, Απο-copκαθορίζει εάν ένα μοντέλο διακρίνει μεταξύ των ανθρώπινων συγγραφέων κειμένων και των παραφράσεων που παράγονται από το AI. Αυτό υποδηλώνει εάν το μοντέλο έχει προηγούμενη γνώση από τα δεδομένα κατάρτισης του. Οι ερευνητές διερεύνησαν τα μοντέλα GPT-4O, GPT-3.5 Turbo και άλλα μοντέλα OpenAI, χρησιμοποιώντας 13.962 αποσπάσματα από 34 βιβλία O’Reilly για να εκτιμήσουν την πιθανότητα συμπερίληψης σε σύνολα δεδομένων κατάρτισης.

Τα αποτελέσματα έδειξαν ότι η GPT-4O αναγνώρισε σημαντικά περισσότερο περιεχόμενο βιβλίου O’Reilly από τα παλαιότερα μοντέλα όπως το GPT-3.5 Turbo. Σύμφωνα με το έγγραφο, η GPT-4O πιθανότατα αναγνωρίζει πολλά μη δημόσια βιβλία O’Reilly που δημοσιεύθηκαν πριν από την ημερομηνία αποκοπής της κατάρτισης. O’Reilly δεν έχει συμφωνία αδειοδότησης με την OpenAI, σύμφωνα με το έγγραφο.

Οι συν-συγγραφείς αναγνωρίζουν ότι η μέθοδος δεν είναι ανόητη και η OpenAI μπορεί να έχει συλλέξει αποσπάσματα από τις εισόδους ChatGPT των χρηστών. Μια άλλη προειδοποίηση είναι ότι τα πιο πρόσφατα μοντέλα OpenAI, συμπεριλαμβανομένων των GPT-4,5, δεν αξιολογήθηκαν.

Το OpenAI, υποστηρίζοντας τους περιορισμούς των πνευματικών δικαιωμάτων, έχει ζητήσει δεδομένα κατάρτισης υψηλότερης ποιότητας, προσλαμβάνοντας δημοσιογράφους για να τελειοποιήσουν τις εξόδους μοντέλων. Η εταιρεία διαθέτει επίσης συμφωνίες αδειοδότησης με εκδότες ειδήσεων και προσφέρει μηχανισμούς εξαίρεσης για τους ιδιοκτήτες πνευματικών δικαιωμάτων. Το OpenAi δεν έχει σχολιάσει το χαρτί.


Προτεινόμενη πίστωση εικόνας



VIA: DataConomy.com

- Advertisement -
- Advertisment -
Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -