back to top
Πέμπτη, 22 Μαΐου, 2025
ΑρχικήTechnologyΓύρω από την τεχνητή νοημοσύνη επικεντρώθηκε το φετινό #Google I/O 2025

Γύρω από την τεχνητή νοημοσύνη επικεντρώθηκε το φετινό #Google I/O 2025

- Advertisment -


Κεντρική θέμα συζήτησης στο φετινό Google I/O 2025 αποτέλεσε η Τεχνητή Νοημοσύνη και σε αυτή την εκδήλωση έχουμε μια σειρά από σχειτκές ανακοινώσεις. Λάβαμε ενημερώσεις και νέες δυνατότητες για τα μοντέλα Gemini 2.5 (Pro και Flash), μαζί με την πιο ισχυρή γεννήτρια εικόνων Imagen 4 και τη γεννήτρια βίντεο AI Veo 3. Η Google παρουσίασε επίσης το Flow – ένα ειδικό εργαλείο δημιουργίας ταινιών AI που συνδυάζει μοντέλα Imagen, Veo και Gemini για τη δημιουργία κινηματογραφικών σκηνών από απλές προτροπές κειμένου.

Θα μας επιτρέψετε να ξεκινήσουμε την περιγραφή με την νέα έκδοση Gemini 2.5 που πλέον προσφέρει εκτεταμένη υποστήριξη γλωσσών σε πάνω από 24 γλώσσες με μετατροπή κειμένου σε ομιλία και εκφραστικές φωνές. Η Google ισχυρίζεται ότι έχει βελτιώσει τη συλλογιστική, την πολυτροπικότητα, τον κώδικα και τις δυνατότητες μακρού πλαισίου τόσο για τα μοντέλα Flash όσο και για τα μοντέλα Pro.

Συγκεκριμένα, στο μοντέλο Pro είχαμε την προσθήκη της λειτουργίας συλλογισμού Deep Think για εξαιρετικά σύνθετες μαθηματικές και κωδικοποιητικές εργασίες. Η λειτουργία βρίσκεται ακόμη σε “πειραματική” φάση και θα κυκλοφορήσει σύντομα σε αξιόπιστους testers. Η Google λέει ότι μπορεί να εξετάσει πολλαπλές υποθέσεις πριν απαντήσει.

Μιλώντας με περισσότερη σαφήνεια, το Gemini 2.5 Pro είναι πλέον η κορυφαία λειτουργία τεχνητής νοημοσύνης στα benchmarks του WebDev Arena και του LMArena. Προσφέρει βελτιωμένα εργαλεία κωδικοποίησης και δημιουργίας εφαρμογών ιστού και έως και 1 εκατομμύριο token window για κατανόηση μακροχρόνιου περιβάλλοντος. Το Gemini 2.5 βελτιώνει επίσης την ασφάλεια έναντι έμμεσων prompt injections.

Έτσι για να γίνουν οι πρώτες επαφές, το Gemini 2.5 Flash είναι τώρα διαθέσιμο σε preview μορφή για όλους τους χρήστες στην εφαρμογή Gemini, ενώ η γενική κυκλοφορία του θα γίνει αργότερα τον Ιούνιο. Η εμπορική κυκλοφορία του Gemini 2.5 Pro θα ακολουθήσει λίγο αργότερα.

Περνάμε στο Imagen 4 που φέρει την ικανότητα να παράγει εικόνες σε ανάλυση έως και 2K. Η Google ισχυρίζεται ότι βελτίωσε την ακρίβεια κειμένου σε κάρτες, αφίσες και κόμικς που δημιουργούνται. Το Imagen 4 είναι διαθέσιμο από σήμερα στις εφαρμογές Gemini, Google Workspace, Whisk και Vertex AI.

Υπάρχει και το Veo 3, είναι το νεότερο μοντέλο βίντεο με τεχνητή νοημοσύνη της Google και διαθέτει βελτιωμένη αναγνώριση κειμένου σε βίντεο. Μπορεί να παράγει βίντεο με ήχο, διαλόγους χαρακτήρων και θορύβους φόντου. Το Veo 3 είναι διαθέσιμο από σήμερα για τους συνδρομητές του Google AI Ultra στις ΗΠΑ και τους εταιρικούς χρήστες του Vertex AI.

Εδώ να συμπληρώσουμε πως το Veo 2 αποκτά λειτουργίες κινήσεων κάμερας, προσθήκης και αφαίρεσης αντικειμένων. Οι χρήστες μπορούν επίσης να προσθέσουν εικόνες για έλεγχο στυλ και outpainting για να επεκτείνουν τα πλαίσια πέρα ​​από τα αρχικά όρια.

 

Το Flow είναι το νέο εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη της Google, το οποίο συνδυάζει τις δυνατότητες των μοντέλων Veo, Imagen και Lyria για κινηματογραφικές σκηνές με περισσότερες λεπτομέρειες. Η Google ισχυρίζεται ότι το Flow μπορεί να βοηθήσει τους αφηγητές να δημιουργήσουν εξαιρετικά κινηματογραφικά κλιπ που διαπρέπουν στη φυσική και τον ρεαλισμό. Οι χρήστες μπορούν να ελέγχουν την κίνηση της κάμερας, τις γωνίες και τις προοπτικές. Μπορείτε επίσης να επεξεργαστείτε και να επεκτείνετε βίντεο που έχουν δημιουργηθεί προηγουμένως. Το Google Flow είναι πλέον διαθέσιμο στους συνδρομητές του Google AI Pro και Ultra στις ΗΠΑ.

- Advertisement -
Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -