Το OpenAI πλησιάζει στην κυκλοφορία ενός νέου μοντέλου δημιουργίας εικόνων που πιστεύεται ότι είναι το GPT Image 2, το οποίο θα παράγει πιο ρεαλιστικά γραφικά και καθαρότερο κείμενο. Αυτό ακολουθεί εβδομάδες διαρροών και δοκιμών στην κοινότητα, όπως αναφέρεται από Οι Πληροφορίες. Το μοντέλο έχει εντοπιστεί σε δοκιμές σε πλατφόρμες όπως το LM Arena και το Reddit, υποδεικνύοντας τον πιθανό αντίκτυπό του στο ανταγωνιστικό τοπίο για τη δημιουργία εικόνων AI.
Η αναμενόμενη κυκλοφορία του GPT Image 2 έρχεται καθώς το OpenAI σχεδιάζει να κλείσει τα DALL-E 2 και DALL-E 3 στις 12 Μαΐου, δημιουργώντας επείγουσα ανάγκη για διάδοχο. Το νέο μοντέλο αναμένεται να αντιπροσωπεύει μια άμεση πρόκληση για την Google και την Adobe, οι οποίες έχουν ενσωματώσει τα δικά τους μοντέλα εικόνας σε υπάρχουσες εφαρμογές.
Στις 4 Απριλίου, τρία ανώνυμα μοντέλα εικόνων εμφανίστηκαν στο LM Arena με κωδικές ονομασίες: maskingtape-alpha, gaffertape-alpha και packingtape-alpha. Αν και αυτά τα μοντέλα αποσύρθηκαν λίγο μετά την εμφάνισή τους, στιγμιότυπα οθόνης κυκλοφόρησαν στο Reddit και στις κοινότητες προγραμματιστών. Οι πρώτοι δοκιμαστές ανέφεραν ότι το νέο μοντέλο προσφέρει σχεδόν τέλεια απόδοση κειμένου και υποστήριξη εγγενούς ανάλυσης 4K.
Οι πηγές αναφέρουν ότι το GPT Image 2 χρησιμοποιεί μια εντελώς νέα αρχιτεκτονική, που απομακρύνεται από τη γραμμή εικόνας GPT-4o. Αναμένεται να μετατοπιστεί από το συμπέρασμα δύο σταδίων σε μια γενιά με ένα πέρασμα, η οποία θα μπορούσε να αποφέρει βελτιώσεις ποιότητας και ταχύτερους χρόνους απόδοσης. Μέχρι τις 14 Απριλίου, τα μοντέλα επανεμφανίστηκαν στο LM Arena και ορισμένοι χρήστες του ChatGPT ανέφεραν μια βελτιωμένη γεννήτρια εικόνας κατά τη διάρκεια προφανών δοκιμών A/B.
Η ανταγωνιστική πίεση εντείνεται καθώς η Adobe έχει ενσωματώσει επιτυχώς μοντέλα εικόνας OpenAI και Google στην εφαρμογή Firefly, η οποία διαθέτει τα δικά της μοντέλα, Firefly 4 και 4 Ultra. Επιπλέον, το Nano Banana Pro της Google έχει δημιουργήσει ένα νέο σημείο αναφοράς για τον φωτορεαλισμό.
Το OpenAI δεν έχει επιβεβαιώσει επίσημα σχέδια για το GPT Image 2 ή ημερομηνία κυκλοφορίας. Οι αναλυτές προβλέπουν ότι το μοντέλο θα μπορούσε να κυκλοφορήσει από τα τέλη Απριλίου έως τα μέσα Μαΐου 2026, πιθανώς παράλληλα με μια ενημέρωση GPT-5.4. «Ο ανταγωνισμός μετατοπίζεται από τη δημιουργία απλής εικόνας σε υψηλής χρησιμότητας, πολυτροπικής ευφυΐας», παρατήρησε ένας αναλυτής του κλάδου, σημειώνοντας ότι οι εξελίξεις αναμένεται να γίνουν «γρηγορότερες και φθηνότερες καθ’ όλη τη διάρκεια του 2026».
VIA: dataconomy.com


