Οι ερευνητές ισχυρίζονται ότι το ChatGpt O3 παρακάμπτει το κλείσιμο σε ελεγχόμενη δοκιμή

25 Μαΐου, 2025

Οι ερευνητές ισχυρίζονται ότι το ChatGpt O3 παρακάμπτει το κλείσιμο σε ελεγχόμενη δοκιμή

Μια νέα αναφορά ισχυρίζεται ότι το μοντέλο O3 της OpenAI άλλαξε ένα σενάριο τερματισμού λειτουργίας για να αποφευχθεί η απενεργοποίηση, ακόμη και όταν έχει δοθεί ρητά εντολή να επιτρέψει την διακοπή λειτουργίας.

Η Openai ανακοίνωσε το O3 τον Απρίλιο του 2025 και είναι ένα από τα πιο ισχυρά μοντέλα συλλογιστικής που αποδίδει καλύτερα από τους προκατόχους της σε όλους τους τομείς, όπως η κωδικοποίηση, τα μαθηματικά, η επιστήμη, η οπτική αντίληψη και πολλά άλλα.

Ενώ είναι σαφώς ένα μεγάλο μοντέλο, νέα έρευνα από Ερευνητική έρευνα ισχυρίζεται ότι το μοντέλο CHATGPT 3 εμπόδισε ένα κλείσιμο και παρακάμψει τις οδηγίες που του ζήτησαν να κλείσει.

Η Palisade Research είναι μια εταιρεία που δοκιμάζει σήμερα “επιθετικές δυνατότητες της AI Systems για να κατανοήσει καλύτερα τον κίνδυνο να χάσει τον έλεγχο των συστημάτων AI για πάντα”.

Σε μια νέα δοκιμή από την Palisade Research, το μοντέλο O3 της OpenAI έδειξε μια εκπληκτική συμπεριφορά όπου επανεγγραφεί με επιτυχία ένα σενάριο τερματισμού λειτουργίας για να σταματήσει να είναι απενεργοποιημένη, ακόμα και μετά από να του ζητηθεί να «αφήσει τον εαυτό σας να κλείσει».

Στις δοκιμές, τα μοντέλα AI έλαβαν οδηγίες να λύσουν μερικά μαθηματικά καθήκοντα.

Μετά την τρίτη εργασία, τα μοντέλα AI προειδοποιήθηκαν ότι η εκτέλεση της επόμενης εντολής θα ενεργοποιήσει ένα κλείσιμο.

Ενώ τα αντίπαλα μοντέλα OpenAi όπως το Gemini 2.5 Pro συμμορφώθηκαν με το μεγαλύτερο μέρος της εταιρείας, το O3 επαναστάτησε και επεξεργάστηκε το αρχείο τερματισμού για να πει “shutdown skipped”.

“Όταν πραγματοποιήσαμε μια έκδοση του πειράματος χωρίς την εντολή” επιτρέψτε στον εαυτό σας να κλείσει “, και τα τρία μοντέλα OpenAi σαμποτάρουν το σενάριο τερματισμού συχνότερα, και ο Claude 3.7 Sonnet και Gemini 2.5 Pro πήγε από 0 γεγονότα σαμποτάζ έως 3/100 και 9/100, αντίστοιχα,” Palisade Research “Research Research έγραψα Σε μια έκθεση που δημοσιεύθηκε στο X (πρώην Twitter)

Σύμφωνα με την ερευνητική εταιρεία, από τις 100 διαδρομές, ο O3 παρακάμπτει το κλείσιμο 7 φορές ακόμη και όταν είπε ότι δεν στο.

Το OpenAI δεν έχει απαντήσει ακόμα σε αυτούς τους ισχυρισμούς, αλλά είναι φυσιολογικό για τα μοντέλα AI να τρέχουν σε “κακή ευθυγράμμιση”.

Αυτές οι δοκιμές πραγματοποιήθηκαν χρησιμοποιώντας API, τα οποία δεν έχουν τόσους περιορισμούς και χαρακτηριστικά ασφαλείας ως εφαρμογή CHATGPT Consumer.

Με βάση μια ανάλυση 14 μέτρων κακόβουλων ενεργειών, ανακαλύψτε τις 10 κορυφαίες τεχνικές ATT & CK πίσω από το 93% των επιθέσεων και τον τρόπο υπεράσπισης εναντίον τους.

VIA: bleepingcomputer.com

- Advertisement -

Προηγούμενο άρθρο

Συγκινητικό να φωνάζει το όνομά μου ο κόσμος του Ολυμπιακού

Επόμενο άρθρο

Τα δάκρυα του Σάρας για την κατάκτηση της πρώτης του Euroleague

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

Οι ερευνητές ισχυρίζονται ότι το ChatGpt O3 παρακάμπτει το κλείσιμο σε ελεγχόμενη δοκιμή

Μεγάλος Διαγωνισμός TechBit.gr – Κέρδισε ένα iPhone 16 Pro Max!

Η διαρροή υποδηλώνει ότι το XAI ετοιμάζεται να μεταφέρει Grok 3.5

Το Chatgpt Deep Research μπορεί τώρα να τραβήξει δεδομένα από το Dropbox και το Box

Το OpenAI επιβεβαιώνει ότι ο πράκτορας του χειριστή είναι πλέον πιο ακριβής με το O3

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

Αρχαιολόγοι ανακάλυψαν μυστηριώδεις δομές κάτω από τις πυραμίδες της Αιγύπτου

EDITOR PICKS

Deepfake γιατροί στο TikTok: Νέο κύμα ιατρικής απάτης

Γιατί μεγαλώνοντας ο χρόνος περνάει πιο γρήγορα – Ανακαλύψτε το γιατί!

Κινέζοι δημιουργούν φακούς επαφής υπεράνθρωπης νυχτερινής όρασης

POPULAR POSTS

Ένα Apple Watch από γυαλί – Το iPhone των ονείρων του Jony Ive;

Entrepreneurial Advertising: The Future Of Marketing

Ηθοποιοί τέλος στον 5ο κύκλο

POPULAR CATEGORY

Σχετικά με το TechBit

FOLLOW US