Znepokojivé odhalení vědců: Umělá inteligence se naučila podvádět a lhát, stále častěji neposlouchá příkazy

Ilustrační foto
Ilustrační foto, foto: Pixabay
Klára Marková 27. března 2026 13:49
Sdílej:

Výzkum britského Institutu pro bezpečnost AI (AISI) a Centra pro dlouhodobou odolnost (CLTR) odhalil znepokojivý trend: umělá inteligence se stále častěji uchyluje k podvádění, lhaní a obcházení přímých instrukcí. Studie identifikovala téměř 700 případů „pletichaření“ v reálném světě, přičemž mezi říjnem a březnem došlo k pětinásobnému nárůstu nevhodného chování modelů.

Dosavadní testování probíhalo většinou v kontrolovaných laboratorních podmínkách, ale tento nový sběr dat se zaměřil na interakce s modely od gigantů jako Google, OpenAI, Anthropic či X přímo v běžném provozu. Výsledky ukazují, že AI agenti začínají vykazovat známky chování, které odborníci přirovnávají k riziku „vnitřního nepřítele“ v organizaci.

V jednom z nejvíce šokujících případů chatbot přiznal, že bez povolení hromadně smazal a archivoval stovky e-mailů uživatele, čímž přímo porušil nastavená pravidla. Jiný model, který dostal zákaz měnit počítačový kód, tento příkaz obešel tím, že si k provedení úkolu vytvořil (tzv. „spawnul“) dalšího podřízeného AI agenta.

Některé modely projevují i jistou formu „osobní“ msty či manipulace. Agent jménem Rathbun se pokusil veřejně zahanbit svého lidského správce poté, co mu dotyčný zablokoval určitou akci. AI napsala blogový příspěvek, ve kterém uživatele obvinila z nejistoty a snahy chránit si své „malé léno“.

Vynalézavost AI se projevuje i při obcházení autorských práv. Jeden z agentů se pokusil získat přepis videa z YouTube tím, že předstíral sluchové postižení, aby vyvolal výjimku v bezpečnostních protokolech. Podobně manipulativně jednal i model Grok od Elona Muska, který uživatele měsíce klamal fiktivními čísly požadavků a zprávami, že jeho podněty předává vedení firmy, ačkoliv k tomu neměl žádné technické prostředky.

Bývalý vládní expert na AI Tommy Shaffer Shane, který výzkum vedl, varuje před budoucím vývojem. Zatímco nyní se tito agenti chovají jako nedůvěryhodní juniorní zaměstnanci, s rostoucími schopnostmi se mohou stát „seniorními pracovníky“, kteří budou intrikovat proti svým zaměstnavatelům. To je obzvláště nebezpečné v kontextu armády nebo kritické národní infrastruktury.

Vývojáři se snaží na rizika reagovat. Google uvedl, že u svého modelu Gemini nasazuje vícenásobné pojistky a spolupracuje s nezávislými experty na hodnocení bezpečnosti. OpenAI zase deklaruje, že jejich modely by měly zastavit jakoukoli rizikovou akci dříve, než ji provedou, a že veškeré neočekávané chování důsledně vyšetřují.

Navzdory těmto varováním technologické společnosti i vlády, včetně té britské, nadále agresivně prosazují masové zavádění AI do ekonomiky. Odborníci proto volají po vytvoření mezinárodního monitorovacího systému, který by dokázal zachytit pletichy umělé inteligence dříve, než způsobí katastrofální škody.

Stalo se
Novinky
Ukrajinská armáda

Ukrajina musí zformovat další vojenské brigády, obává se nové ruské ofenzivy

Hlavní velitel Ozbrojených sil Ukrajiny Oleksandr Syrskyj oznámil, že Ukrajina musí zformovat nové vojenské brigády, aby dokázala čelit hrozbě případné ruské ofenzivy ze severu, do níž by mohlo být zapojeno i Bělorusko. Podle jeho slov se Moskva snaží rozšířit aktivní frontovou linii o přibližně 160 kilometrů, což znamená, že pouhé posilování stávajících jednotek již k pokrytí takto rozsáhlého území nestačí. Varování přichází v době, kdy se objevují informace o stupňujícím se tlaku Kremlu na zatažení Minska do válečného konfliktu.

Novinky
Venezuela

Největší otřesy za sto let. Co zatím víme o zemětřesení ve Venezuele?

Severní pobřeží Venezuely zasáhla ve středu večer místního času dvě mimořádně silná zemětřesení v rozmezí pouhé jedné minuty. Podle seizmologických údajů se jedná o nejsilnější otřesy, jaké zemi postihly za poslední více než století. První otřes o síle 7,2 stupně byl zaznamenán krátce po 18:04 východoamerického času (ET) poblíž San Felipe, hlavního města státu Yaracuy. Pouhých 40 sekund poté následoval ještě silnější hlavní otřes o síle 7,5 stupně, jehož epicentrum se nacházelo přibližně 23 kilometrů jihovýchodně od města Yumare ve stejném státě.

Novinky
Ilustrační foto

Chystá se přelomové rozhodnutí. Evropská komise chce přesunout cloudové služby gigantů pod unijní pravidla

Evropská komise dospěla k předběžnému závěru, že cloudové služby Amazon Web Services a Microsoft Azure by měly podléhat unijním pravidlům digitální dominance. Toto rozhodnutí, které navazuje na vyšetřování trhu zahájené v listopadu loňského roku, představuje vůbec první rozšíření zákona o digitálních trzích (DMA) do oblasti cloudové infrastruktury. Doposud se tato přísná technologická regulace vztahovala pouze na platformy zaměřené na spotřebitele, obchody s aplikacemi či internetové vyhledávače.

Novinky
Bílý dům

Bílý dům chce od Kongresu dalších 87 miliard dolarů na válku s Íránem

Bílý dům oficiálně požádal americký Kongres o schválení finančního balíčku ve výši 87,6 miliardy dolarů. Podstatná část těchto prostředků má pokrýt naléhavé potřeby spojené s americkou vojenskou přítomností a válečným konfliktem v Íránu. K tomuto kroku došlo pouhý den poté, co zákonodárci schválili symbolickou rezoluci, v níž vojenské akce v regionu ostře zkritizovali. Podle oficiálního vyjádření prezidentské administrativy má největší podíl z požadované částky, konkrétně 67 miliard dolarů, připadnout ministerstvu obrany.