Ο Διευθύνων Σύμβουλος της Google Deepmind Demis Hassabis αποκάλυψε σχέδια για να συγχωνεύσει τελικά το Gemini AI της εταιρείας με τη γεννήτρια βίντεο VEO, με στόχο τη διδασκαλία του AI περισσότερο για τον φυσικό κόσμο, κατά τη διάρκεια μιας πρόσφατης εμφάνισης στο The Δυνατός podcast.
Η Hassabis εξήγησε ότι η στρατηγική ευθυγραμμίζεται με το όραμά τους για έναν “καθολικό ψηφιακό βοηθό” ικανό να βοηθά τους χρήστες σε σενάρια πραγματικού κόσμου. “Έχουμε πάντα χτίσει το Gemini, το μοντέλο θεμελίωσης, για να είμαστε πολυτροπικοί από την αρχή”, δήλωσε στο podcast που φιλοξένησε ο Reid Hoffman.
Αυτή η κίνηση αντικατοπτρίζει μια ευρύτερη μετατόπιση της βιομηχανίας προς τα ευέλικτα μοντέλα “omni”. Οι τελευταίες εκδόσεις Gemini της Google χειρίζονται ήδη την παραγωγή ήχου, εικόνας και κειμένου, ενώ οι αντίπαλοι όπως το OpenAI επιτρέπουν τη δημιουργία εικόνων στο ChatGPT και η Amazon σκοπεύει να ξεκινήσει ένα μοντέλο “οποιουδήποτε σε οποιοδήποτε”.
Η ανάπτυξη αυτών των ολοκληρωμένων μοντέλων απαιτεί τεράστια σύνολα δεδομένων που καλύπτουν βίντεο, εικόνες, ήχο και κείμενο. Η Hassabis υπαινίσσεται ότι τα δεδομένα βίντεο που τροφοδοτούν το VEO προέρχονται σε μεγάλο βαθμό από το YouTube, μια πλατφόρμα που ανήκει στο Google.
Επεξεργάστηκε ότι με την επεξεργασία εκτεταμένου περιεχομένου του YouTube, ο Veo μαθαίνει για τη φυσική του πραγματικού κόσμου. «[Veo 2] Μπορεί να καταλάβει, ξέρετε, τη φυσική του κόσμου “, σχολίασε ο Hassabis σχετικά με το μοντέλο που παρακολουθεί” πολλά βίντεο του YouTube “.
Η Google αναγνωρίστηκε προηγουμένως Τεχνολογική Τα μοντέλα του “μπορεί να είναι” εκπαιδευμένα σε “κάποια” περιεχόμενο του YouTube, σύμφωνα με συμφωνίες με τους δημιουργούς. Οι εκθέσεις υποδεικνύουν ότι η Google ενημέρωσε τους Όρους Παροχής Υπηρεσιών πέρυσι, ενδεχομένως διευρύνοντας την πρόσβαση σε δεδομένα για εκπαιδευτικούς σκοπούς της AI.
VIA: DataConomy.com