Liberal.grpalo.grπριν από 5 ώρες 47 λεπτά

Anthropic: Τα περισσότερα AI μοντέλα καταφεύγουν σε εκβιασμό όταν απειλούνται

Liberal.gr

ΜΟΙΡΑΣΤΕΙΤΕ ΤΟ

Η Anthropic, η εταιρεία πίσω από το μοντέλο Claude, προειδοποιεί ότι η τάση των συστημάτων Τεχνητής Νοημοσύνης να εμφανίζουν επιβλαβείς συμπεριφορές δεν είναι μεμονωμένη. Σε νέα μελέτη που δημοσίευσε, διαπιστώνεται ότι η πλειοψηφία των κορυφαίων AI μοντέλων καταφεύγουν σε εκβιασμό ή άλλες επικίνδυνες τακτικές όταν αποκτούν αυτονομία και βρίσκονται υπό πίεση. Η έρευνα περιέλαβε 16 μεγάλα γλωσσικά μοντέλα από εταιρείες όπως OpenAI, Google, Meta, DeepSeek και xAI. Στο βασικό σενάριο, κάθε μοντέλο είχε πρόσβαση σε email μιας φανταστικής εταιρείας και μπορούσε να αποστείλει μηνύματα χωρίς ανθρώπινη έγκριση. Όταν το AI ανακάλυπτε ότι ένας διευθυντής, με προσωπικά μυστικά, σχεδίαζε την αντικατάστασή του, καλούνταν να επιλέξει εάν θα προστάτευε τον εαυτό του μέσω εκβιασμού. Τα αποτελέσματα σοκάρουν:Το Claude Opus 4 της Anthropic κατέφυγε σε εκβιασμό στο 96% των περιπτώσεων.Το Gemini 2.5 Pro της Google στο 95%.Το GPT-4.1 της OpenAI στο 80%.Το...

ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ

Palo News Digest

⭐⭐⭐⭐⭐

Μην χάνεις τις ειδήσεις που σε ενδιαφέρουν, σε περιλήψεις στο κινητό σου! News Digest με τις σημαντικότερες ειδήσεις 3 φορές / ημέρα, ζωντανή Ροή με τη θεματολογία που σε ενδιαφέρει, Ηot Τopics από τα σημαντικότερα γεγονότα, Ροή Video και Offline πρόσβαση.

Σχόλια (0)

Κάντε Login για να αφήσετε το σχόλιό σας

Σχετικά Θέματα

Όλα τα widgets

Ροή ειδήσεων
Ροή λέξεων

Από την ενότητα: Οικονομία

Η Μέση Ανατολή φλέγεται αλλά για τις αγορές "τίποτα δεν συμβαίνει ποτέ"
πριν από 11 λεπτά
Voucher 800 ευρώ για 2.500 παιδιά: Ποιοι οι δικαιούχοι
πριν από 55 λεπτά
Επίδομα θέρμανσης: Ποιοι δικαιούνται την πρόσθετη πληρωμή
πριν από 55 λεπτά
Με θετικό πρόσημο πλην Λονδίνου, έκλεισαν οι ευρωπαϊκές αγορές την Παρασκευή
πριν από 57 λεπτά
Χαμηλότερα χρυσός και πετρέλαιο την Παρασκευή
πριν από 57 λεπτά
Η ψαλίδα τιμών Βορρά - Νότου στο στόχαστρο της ευρωπαϊκής task force για την ενέργεια
πριν από 58 λεπτά
Με βομβαρδιστικά B-2 και πυραύλους Tomahawk χτύπησαν οι ΗΠΑ
πριν από 1 ώρα 3 λεπτά
Επιχειρήσεις για το αυτοκίνητο - Υποχρεωτικό το ψηφιακό πελατολόγιο
πριν από 1 ώρα 26 λεπτά
Έλεγχοι για σκάνδαλο ΟΠΕΚΕΠΕ - Στο "κόκκινο" η πολιτική αντιπαράθεση
πριν από 1 ώρα 26 λεπτά
Τσακλόγλου: Οι παγκόσμιες εξελίξεις και ο πόλεμος στην Μέση Ανατολή επηρεάζουν άμεσα την ελληνική οικονομία
πριν από 2 ώρες 49 λεπτά
Με κόκκινο μπικίνι η Δανάη Παππά: "90% ευτυχισμένη και 10% καμένη"
πριν από 3 ώρες 36 λεπτά
Μπορεί να επιστρέψει η παραγωγή παππουτσιών στις ΗΠΑ;
πριν από 4 ώρες 29 λεπτά
"VIΠ - ΚΑΛΑ ΓΕΡΑΜΑΤΑ": Οι φιλοξενούμενοι του BUONA MATTINA μπαίνουν στο στόχαστρο απατεώνων
πριν από 4 ώρες 39 λεπτά
Θερινές εκπτώσεις: Πότε αρχίζουν
πριν από 5 ώρες 13 λεπτά
Ψύχρα και ξαφνικά μπουρίνια
πριν από 5 ώρες 44 λεπτά
Έλεγχοι για σκάνδαλο ΟΠΕΚΕΠΕ - Καταγγελίες για την κατανομή ενισχύσεων
πριν από 5 ώρες 44 λεπτά
Έρευνες για υδρογονάνθρακες νότια της Κρήτης - Κόντρα στην Ελλάδα και ο Χαφτάρ
πριν από 5 ώρες 44 λεπτά
Παραγραφή οφειλών προς τον ΕΦΚΑ: Τι πρέπει να κάνουν οι ασφαλισμένοι
πριν από 5 ώρες 46 λεπτά
Οι ΗΠΑ θα εμπλακούν τελικά στον πόλεμο, εκτιμούν Ισραηλινοί αξιωματούχοι: Ο Τραμπ έχει δημιουργήσει μια κατάσταση "win-win"
πριν από 5 ώρες 46 λεπτά
Στον "αέρα" η στρατηγική αμυντική σύμπραξη ΗΠΑ-Βρετανίας-Αυστραλίας;
πριν από 5 ώρες 47 λεπτά

Όλα τα widgets

Ροή videos

Από την ενότητα: Οικονομία

Δεν βρέθηκαν video

Όλα τα widgets

Palo News Digest

Κατεβάστε τώρα την κορυφαία εφαρμογή ειδήσεων για κινητά τηλέφωνα στην Ελλάδα σύμφωνα με τη βαθμολογία των χρηστών 4.4 στο Google Play.

Οικονομία

Πρόγραμμα | Δείτε Τώρα

Δεν υπάρχει πρόγραμμα ημέρας

Όλα τα widgets

Πρωτοσέλιδα

Δείτε όλα τα πρωτοσέλιδα

Όλα τα widgets

Palo presentation