Καταναλώνουμε περισσότερη τεχνητή νοημοσύνη απ' όση μπορούμε να… παράξουμε


Ο «πυρετός» της τεχνητής νοημοσύνης στερεύει έναν πόρο χωρίς τον οποίο οι προγραμματιστές AI δεν μπορούν να λειτουργήσουν: την υπολογιστική ισχύ.

Η έντονη έλλειψη χωρητικότητας έχει προκαλέσει ανησυχία στους απαιτητικούς χρήστες, έχει αναγκάσει εταιρείες να ακυρώσουν προϊόντα και έχει οδηγήσει σε προβλήματα αξιοπιστίας. Τα ζητήματα αυτά αποτελούν προειδοποιητικό σημάδι για την άνθηση της AI, καθώς ενδέχεται να περιορίσουν τη χρησιμότητα ισχυρών νέων εργαλείων ακριβώς τη στιγμή που τεράστιοι αριθμοί χρηστών αρχίζουν να βασίζονται σε αυτά για αύξηση της παραγωγικότητας.

Τους τελευταίους μήνες, η ζήτηση έχει εκτοξευθεί για την agentic AI, δηλαδή αυτόνομα εργαλεία που χρησιμοποιούν την τεχνολογία για να εκτελούν ανεξάρτητα εργασίες — από τη συγγραφή κώδικα έως τον προγραμματισμό επισκέψεων σε ακίνητα για μεσίτες. Οι εταιρείες προσπαθούν απεγνωσμένα να εξασφαλίσουν την απαραίτητη υπολογιστική ισχύ για να εξυπηρετήσουν μια αυξανόμενη βάση πελατών που ταυτόχρονα αυξάνει σημαντικά τη χρήση AI.

«Όλοι μιλούν για το πετρέλαιο, αλλά νομίζω ότι αυτό που λείπει κυρίως από τον κόσμο είναι τα tokens», δήλωσε ο Ben Pouladian, μηχανικός και επενδυτής τεχνολογίας στο Λος Άντζελες. Το token είναι μονάδα μέτρησης στην AI που παρακολουθεί πόσοι υπολογιστικοί πόροι χρησιμοποιούνται για μια εργασία. «Η AI πλέον δεν είναι απλώς ένα chatbot που ρωτάμε για μια συνταγή μπροστά στο ψυγείο. Οργανώνει εργασίες, γίνεται πιο έξυπνη», είπε.

Όλα αυτά δείχνουν, όπως τονίζει η Journal, ένα κλασικό πρόβλημα που εμφανίζεται σε τεχνολογικές εκρήξεις κατά την ιστορία — από την επέκταση των σιδηροδρόμων τον 19ο αιώνα έως την έκρηξη των τηλεπικοινωνιών και του διαδικτύου στις αρχές της δεκαετίας του 2000. Η ζήτηση αυξάνεται πολύ πιο γρήγορα από ό,τι μπορούν οι εταιρείες να εξασφαλίσουν πόρους και να αναπτύξουν υποδομές. Ιστορικά, η αύξηση τιμών είναι ένας από τους λίγους τρόπους αντιμετώπισης της έλλειψης, αλλά αυτό μπορεί να αποδειχθεί επικίνδυνο για τις κορυφαίες εταιρείες AI που ανταγωνίζονται έντονα για χρήστες.

Οι ωριαίες τιμές ενοικίασης GPUs —των μικροτσίπ που χρησιμοποιούνται για την εκπαίδευση και λειτουργία μοντέλων AI— έχουν εκτοξευθεί από το φθινόπωρο. Η Anthropic, δημιουργός του δημοφιλούς chatbot και της εφαρμογής προγραμματισμού Claude Code, αντιμετωπίζει συχνά διακοπές λειτουργίας. Η εταιρεία έχει αρχίσει να περιορίζει τη χρήση υπολογιστικών πόρων σε ώρες αιχμής, αλλά η εφαρμογή του μέτρου έχει προκαλέσει παράπονα χρηστών που φτάνουν γρήγορα τα όρια.

Η OpenAI εγκατέλειψε εν μέρει την εφαρμογή δημιουργίας βίντεο Sora για να απελευθερώσει υπολογιστικούς πόρους και να ενισχύσει προϊόντα προγραμματισμού και επιχειρήσεων που θα λειτουργούν με νέο μοντέλο AI με την κωδική ονομασία Spud, σύμφωνα με τη Wall Street Journal.

Η χρήση tokens στο API της OpenAI —πλατφόρμα όπου κυρίως επιχειρήσεις χρησιμοποιούν το λογισμικό της— αυξήθηκε από 6 δισεκατομμύρια το λεπτό τον Οκτώβριο σε 15 δισεκατομμύρια το λεπτό στα τέλη Μαρτίου.

«Ξοδεύω πολύ χρόνο προσπαθώντας να βρω διαθέσιμη υπολογιστική ισχύ την τελευταία στιγμή», δήλωσε η Sarah Friar, οικονομική διευθύντρια της OpenAI. «Παίρνουμε πολύ δύσκολες αποφάσεις επειδή δεν έχουμε αρκετή υπολογιστική ισχύ.»

AI cloud

Στα τέλη του περασμένου έτους, η CoreWeave, μία από τις μεγαλύτερες εισηγμένες εταιρείες AI cloud, αύξησε τις τιμές της πάνω από 20% και άρχισε να ζητά από μικρότερους πελάτες να δεσμεύονται σε συμβόλαια τουλάχιστον τριών ετών, αντί για ενός έτους πριν. Αναλυτές της Bank of America εκτιμούν ότι η ζήτηση για τις υπηρεσίες της θα ξεπερνά την προσφορά τουλάχιστον έως το 2029.

Οι τιμές άμεσης αγοράς για πρόσβαση σε GPUs της Nvidia σε cloud data centers έχουν αυξηθεί σημαντικά τους τελευταίους μήνες, σύμφωνα με την Ornn, εταιρεία δεδομένων με έδρα τη Νέα Υόρκη.

Η ενοικίαση ενός από τα πιο προηγμένα τσιπ Blackwell της Nvidia για μία ώρα κοστίζει 4,08 δολάρια, αυξημένη κατά 48% από τα 2,75 δολάρια πριν από δύο μήνες.

«Υπάρχει τεράστια έλλειψη χωρητικότητας, μεγαλύτερη από οτιδήποτε έχω δει στα πέντε χρόνια που ασχολούμαι με αυτόν τον κλάδο», δήλωσε ο J.J. Kardwell, διευθύνων σύμβουλος της Vultr. «Γιατί δεν αναπτύσσουμε απλώς περισσότερο εξοπλισμό; Οι χρόνοι παράδοσης είναι πολύ μεγάλοι. Η κατασκευή data centers παίρνει χρόνο και η διαθέσιμη μέχρι το 2026 είναι ήδη δεσμευμένη.»

Από τα μέσα Φεβρουαρίου, οι διακοπές λειτουργίας στα συστήματα της Anthropic έχουν γίνει τόσο συχνές που ορισμένοι επιχειρηματικοί πελάτες στρέφονται σε άλλους παρόχους AI. 

Η αξιοπιστία των βασικών υπηρεσιών στο διαδίκτυο μετριέται συχνά σε «εννιάρια». Τέσσερα εννιάρια σημαίνουν 99,99% διαθεσιμότητα. Στις 8 Απριλίου, το Claude API της Anthropic είχε διαθεσιμότητα 98,95% τις τελευταίες 90 ημέρες.

«Αυτό δεν είναι φυσιολογικό», δήλωσε ο Amir Haghighat της Baseten. «Σκεφτείτε υπηρεσίες όπως AWS ή Stripe — πρέπει να είναι εξαιρετικά αξιόπιστες. Αλλά αυτό δεν ισχύει ακόμη στην AI.»

Οι συχνές διακοπές συμβαίνουν ενώ η Anthropic αναπτύσσεται εκρηκτικά. Στα τέλη του 2025 έφτασε σε ετήσιο ρυθμό εσόδων 9 δισ. δολαρίων, που αυξήθηκε σε 14 δισ. τον Φεβρουάριο και διπλασιάστηκε σε 30 δισ. δύο μήνες αργότερα.

Στα τέλη Μαρτίου, η εταιρεία ανακοίνωσε ότι θα περιορίσει τη χρήση tokens σε ώρες αιχμής (5 π.μ. – 11 π.μ. ώρα Ειρηνικού). Οι χρήστες διαμαρτυρήθηκαν έντονα στα social media, με έναν να γράφει ότι έφτασε το όριο σε μόλις 45 λεπτά.

«Δουλεύουμε σκληρά για να καλύψουμε τη ζήτηση για το Claude», δήλωσε ο Boris Cherny. «Η χωρητικότητα είναι πόρος που διαχειριζόμαστε προσεκτικά και δίνουμε προτεραιότητα στους πελάτες μας.»

#τεχνητή_νοημοσύνη #ΥΠΟΛΟΓΙΣΤΙΚΗ_ΙΣΧΥΣ #Ενέργεια #ΚΟΣΤΟΣ



VIA: www.reporter.gr

Dimitris Marizas
Dimitris Marizashttps://techbit.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -

Most Popular 48hrs

- Advertisement -

Latest Articles