back to top
Σάββατο, 19 Απριλίου, 2025
ΑρχικήGadgetsΗ Google θέλει να μάθει τι λένε τα δελφίνια με νέο AI...

Η Google θέλει να μάθει τι λένε τα δελφίνια με νέο AI εργαλείο!

- Advertisment -


Λίγες ημέρες μετά την παρουσίαση του Deep Research powered by Gemini 2.5 Pro Experimental, η Google επιστρέφει και πάλι με ένα νέο μοντέλο, το DolphinGemma. Αυτό το μεγάλο γλωσσικό μοντέλο προορίζεται να βοηθήσει τους επιστήμονες να «μελετήσουν πώς επικοινωνούν τα δελφίνια» και «ελπίζουμε να μάθουμε και τι λένε».

Η εταιρεία συνεργάζεται με ερευνητές του Georgia Tech και του Wild Dolphin Project (WDP), με επικεφαλής την ιδρύτριά του, Dr. Denise Herzing. Η πρωταρχική αποστολή του WDP, όπως πιθανώς μπορείτε να μαντέψετε, είναι να παρατηρεί, να καταγράφει και να αναφέρει τις φυσικές συμπεριφορές, τις κοινωνικές δομές, τα πρότυπα επικοινωνίας και τα ενδιαιτήματα των άγριων δελφινιών, και συγκεκριμένα του κηλιδωτού δελφινιού του Ατλαντικού (Stenella frontalis), μέσω «μη επεμβατικής, μακροχρόνιας έρευνας πεδίου».

Με την πάροδο των ετών, το WDP έχει συλλέξει δεδομένα που του επιτρέπουν να συσχετίσει ορισμένους ήχους δελφινιών με συμπεριφορές. Για παράδειγμα:

  • Σφυρίγματα με υπογραφή (μοναδικά ονόματα) που μπορούν να χρησιμοποιηθούν από μητέρες και μοσχάρια για την επανασύνδεση
  • Σπασμωδικές «κραυγές» που παρατηρούνται συχνά κατά τη διάρκεια καυγάδων.
  • Κλικ «βουητά» που χρησιμοποιούνται συχνά κατά τη διάρκεια ερωτοτροπίας ή κυνηγιού καρχαριών

Σύμφωνα με την Google, «η ανάλυση της φυσικής, πολύπλοκης επικοινωνίας των δελφινιών είναι ένα μνημειώδες εγχείρημα και το τεράστιο, επισημασμένο σύνολο δεδομένων του WDP παρέχει μια μοναδική ευκαιρία για πρωτοποριακή τεχνητή νοημοσύνη».

Σε αυτό το σημείο έρχεται το DolphinGemma. Με απλά λόγια, πρόκειται για ένα AI μοντέλο που αναπτύχθηκε από τη Google στο σύνολο δεδομένων του WDP, το οποίο χρησιμοποιεί το δικό του SoundStream tokenizer της Google για να αναλύσει τις φωνές των δελφινιών σε πιο εύχρηστες μονάδες ήχου.

Στη συνέχεια, αυτές περνούν από μια εξειδικευμένη αρχιτεκτονική μοντέλου που έχει σχεδιαστεί για να κατανοεί πολύπλοκες ακολουθίες. Η όλη ρύθμιση έχει περίπου 400 εκατομμύρια παραμέτρους, γεγονός που την καθιστά αρκετά ελαφριά ώστε να τρέχει εγγενώς σε τηλέφωνα Pixel, τα οποία οι ερευνητές του WDP μεταφέρουν μαζί τους στο πεδίο.

Σε αντίθεση με τα παραδοσιακά μοντέλα μηχανικής μάθησης, το DolphinGemma δεν ασχολείται με λέξεις ή εικόνες- είναι αυστηρά audio-in, audio-out. Λαμβάνει ακολουθίες φυσικών φωνητικών εκφράσεων δελφινιών, τις επεξεργάζεται χρησιμοποιώντας μια προσέγγιση εμπνευσμένη από τον τρόπο με τον οποίο τα μεγάλα γλωσσικά μοντέλα κατανοούν την ανθρώπινη ομιλία και προβλέπει τον πιο πιθανό επόμενο ήχο σε μια ακολουθία.

Η Dr. Denise Herzing το συγκρίνει με την αυτόματη συμπλήρωση, αλλά για σφυρίγματα δελφινιών, παλμούς έκρηξης και σειρές κλικ. Είναι εκπαιδευμένο να αναγνωρίζει μοτίβα, δομές και πρόοδο σε αυτούς τους ήχους, όπως ακριβώς ένα μοντέλο που βασίζεται σε κείμενο προβλέπει την επόμενη λέξη σε μια πρόταση με βάση τα συμφραζόμενα.

Πριν έρθει η Google με το DolphinGemma, η ομάδα ερευνητών στο WDP χρησιμοποιούσε το CHAT (Cetacean Hearing Augmentation Telemetry) για να διερευνήσει τη δυνατότητα αμφίδρομης επικοινωνίας με δελφίνια. Ο στόχος με το CHAT δεν ήταν να σπάσουν την πλήρη πολυπλοκότητα της γλώσσας των δελφινιών, αλλά να δημιουργήσουν ένα απλούστερο, κοινό λεξιλόγιο για την αλληλεπίδραση.

Το σύστημα λειτουργεί συσχετίζοντας νέα, συνθετικά σφυρίγματα, που δημιουργούνται από το CHAT, με συγκεκριμένα αντικείμενα που φαίνεται να αρέσουν στα δελφίνια. Σκεφτείτε πράγματα όπως το σάργασσο, το θαλασσόχορτο ή ακόμη και τα κασκόλ που χρησιμοποιούν οι ερευνητές. Η ελπίδα ήταν ότι με την επανειλημμένη συσχέτιση αυτών των συνθετικών σφυριγμάτων με αντικείμενα, τα δελφίνια θα άρχιζαν να μιμούνται τους ήχους για να «ζητούν» αυτά τα αντικείμενα.

Το CHAT έτρεχε από ένα Google Pixel 6, το οποίο χειριζόταν την ανάλυση ήχου υψηλής ποιότητας σε πραγματικό χρόνο. Η χρήση έτοιμων τηλεφώνων σήμαινε ότι η ομάδα δεν χρειαζόταν προσαρμοσμένο εξοπλισμό. Αυτό έκανε τα πράγματα μικρότερα, φθηνότερα, αποτελεσματικότερα και ευκολότερα στη συντήρηση στον ανοιχτό ωκεανό. Για την επερχόμενη σεζόν, θα αναβαθμίσουν στο Pixel 9, το οποίο προσθέτει καλύτερες δυνατότητες ηχείων και μικροφώνων και έχει αρκετή ισχύ για να τρέξει ταυτόχρονα μοντέλα βαθιάς μάθησης και αντιστοίχισης προτύπων.

Όπως και τα άλλα μοντέλα Gemma, η Google λέει ότι φέρνει το DolphinGemma ως ανοιχτό μοντέλο αυτό το καλοκαίρι με την ελπίδα να «δώσει στους ερευνητές σε όλο τον κόσμο τα εργαλεία για να εξορύξουν τα δικά τους σύνολα ακουστικών δεδομένων, να επιταχύνουν την αναζήτηση προτύπων και να εμβαθύνουν συλλογικά την κατανόησή μας για αυτά τα ευφυή θαλάσσια θηλαστικά».

Το Gemma είναι μια οικογένεια ελαφρών μεγάλων γλωσσικών μοντέλων που αναπτύχθηκε από την Google. Η τελευταία προσθήκη στην οικογένεια είναι το Gemma 3, διαθέσιμο σε τέσσερα μεγέθη: 1 δισεκατομμύριο, 4 δισεκατομμύρια, 12 δισεκατομμύρια και 27 δισεκατομμύρια παραμέτρους.

[via]



VIA: TechGear.gr

- Advertisement -
- Advertisment -
Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

- Advertisment -