Η OpenAI παρουσίασε το πιο πρόσφατο μοντέλο τεχνητής νοημοσύνης της, το οποίο, όπως αναφέρει η ίδια, είναι ικανό να «σκέφτεται με εικόνες». Αυτό σημαίνει πως μπορεί να κατανοήσει και να αναλύσει σκίτσα, διαγράμματα και πρόχειρα σχέδια που ανεβάζει ο χρήστης – ακόμη κι αν είναι χαμηλής ποιότητας.
Νέα μοντέλα με έμφαση στη συλλογιστική
Το κύριο νέο μοντέλο ονομάζεται o3, ενώ παράλληλα παρουσιάστηκε και ένα μικρότερο, πιο γρήγορο μοντέλο με την ονομασία o4-mini. Η κυκλοφορία τους ακολουθεί το ντεμπούτο του πρώτου μοντέλου συλλογιστικής της OpenAI, του o1, τον Σεπτέμβριο, το οποίο επικεντρωνόταν στην επίλυση σύνθετων προβλημάτων και στη λήψη αποφάσεων μέσα από πολυβήματη λογική.
Με το μοντέλο o3, οι χρήστες μπορούν να ανεβάζουν εικόνες από λευκοπίνακες, σκίτσα και άλλα διαγράμματα και να ζητούν από την τεχνητή νοημοσύνη να τα αναλύσει και να συζητήσει επάνω σε αυτά. Επιπλέον, τα μοντέλα μπορούν να περιστρέφουν, να κάνουν ζουμ και να χρησιμοποιούν εργαλεία επεξεργασίας εικόνας.
Η OpenAI επεκτείνει τις δυνατότητες πέρα από το κείμενο
Από την εισαγωγή του viral chatbot ChatGPT στα τέλη του 2022, η OpenAI έχει αναβαθμίσει γρήγορα τα μοντέλα της, επεκτείνοντάς τα πέρα από το κείμενο σε εικόνες, φωνή και βίντεο. Η εταιρεία προσπαθεί να παραμείνει μπροστά στον αγώνα για την κυριαρχία στην παραγωγική τεχνητή νοημοσύνη, ανταγωνιζόμενη εταιρείες όπως η Google, η Anthropic και η xAI του Έλον Μασκ.
Όπως δήλωσε η εταιρεία: «Για πρώτη φορά, τα μοντέλα συλλογιστικής μας μπορούν να χρησιμοποιούν ανεξάρτητα όλα τα εργαλεία του ChatGPT – περιήγηση στον ιστό, Python, κατανόηση εικόνας και δημιουργία εικόνας. Αυτό τα βοηθά να λύνουν σύνθετα, πολυβήματα προβλήματα πιο αποτελεσματικά και να κάνουν πραγματικά βήματα προς την ανεξάρτητη δράση».
Οπτική συλλογιστική και ενσωμάτωση πληροφορίας
Η OpenAI, η οποία αποτιμάται στα 300 δισεκατομμύρια δολάρια σύμφωνα με τον τελευταίο γύρο χρηματοδότησης τον περασμένο μήνα, δήλωσε ότι τα μοντέλα o3 και o4-mini είναι τα πρώτα της που μπορούν να «σκέφτονται με εικόνες».
Αυτό σημαίνει ότι «δεν βλέπουν απλώς μια εικόνα, αλλά μπορούν να ενσωματώνουν τις οπτικές πληροφορίες απευθείας στην αλυσίδα συλλογιστικής», σύμφωνα με την ανακοίνωση.
Τον προηγούμενο μήνα, η OpenAI κυκλοφόρησε μια νέα δυνατότητα δημιουργίας εικόνας, η οποία έγινε viral στο διαδίκτυο για την ικανότητά της να παράγει εικόνες σε στυλ Studio Ghibli και anime.
Το μοντέλο o3 έχει ιδιαίτερη ρύθμιση για υψηλή απόδοση σε μαθηματικά, προγραμματισμό, επιστημονική κατανόηση και ανάλυση εικόνων, ενώ το o4-mini έχει σχεδιαστεί για να λειτουργεί πιο γρήγορα και με χαμηλότερο κόστος.
Οι χρήστες τρολάρουν τα ονόματα των μοντέλων
Η κοινότητα της OpenAI αστειεύεται εδώ και καιρό για τα παράξενα ή μπερδεμένα ονόματα των μοντέλων της. Ο CEO της εταιρείας, Σαμ Άλτμαν, μπήκε κι αυτός στο κλίμα, γράφοντας σε ανάρτησή του στο X: «Τι θα λέγατε να φτιάξουμε το θέμα με την ονοματοδοσία των μοντέλων μέχρι το καλοκαίρι, και μέχρι τότε να έχετε μερικούς μήνες ακόμα για να μας κοροϊδεύετε (το αξίζουμε απόλυτα)».
Η ασφάλεια υπό εξέταση
Η εταιρεία ανέφερε ότι και τα δύο μοντέλα έχουν «υποβληθεί στο πιο αυστηρό μας πρόγραμμα δοκιμών ασφάλειας μέχρι σήμερα» και παραπέμπει στο ενημερωμένο «πλαίσιο ετοιμότητας» που δημοσιεύτηκε αυτήn την εβδομάδα.
Ωστόσο, η OpenAI έχει βρεθεί πρόσφατα στο στόχαστρο για αλλαγές στις πολιτικές ασφαλείας της. Η εταιρεία δήλωσε ότι διατηρεί το δικαίωμα να «αλλάξει τις απαιτήσεις ασφαλείας της αν ‘ένας άλλος προγραμματιστής frontier AI κυκλοφορήσει ένα σύστημα υψηλού κινδύνου χωρίς συγκρίσιμα μέτρα ασφαλείας’».
Στο πλαίσιο αυτών των αλλαγών, η OpenAI ανακοίνωσε ότι δεν θα απαιτεί πλέον δοκιμές ασφαλείας για ορισμένα fine-tuned μοντέλα. Επίσης, απέφυγε να δημοσιεύσει μια «model card» – μια αναφορά που περιλαμβάνει πληροφορίες για τις δοκιμές ασφαλείας που έγιναν πριν την κυκλοφορία ενός μοντέλου – για το GPT-4.1.
Τον Φεβρουάριο, η OpenAI είχε λανσάρει το εργαλείο AI agent με την ονομασία Deep Research, εβδομάδες προτού δημοσιεύσει την αντίστοιχη αναφορά του συστήματος.
VIA: FoxReport.gr