Společnost OpenAI představila nejnovější generaci modelů GPT-5.6. Ty přináší vyšší výkon a dostala stejná omezení jako Mythos a Fable od Anthropicu.
OpenAI představila novou generaci svých modelů s názvem GPT-5.6, která se dělí na tři verze: Sol, Terra a Luna. Sol je nejvýkonnějším modelem této řady, zatímco Terra nabízí výkon srovnatelný s předchozím GPT-5.5 za polovinu nákladů a Luna je určená pro rychlé a levné nasazení.
Společnosti sice plánovala okamžitě nasazení, americká vláda nařídila omezené uvedení pouze pro vybrané partnery. To je součástí nového přístupu k regulaci pokročilých AI systémů, který byl zaveden po kontroverzním zákazu modelů Claude Fable 5 a Mythos 5 od společnosti Anthropic. Zde připomeňme, že Claude Fable 5 by se měl mezi veřejnost dostat v průběhu dneška.
GPT-5.6 Sol přináší několik vylepšení oproti předchozím verzím. Nový režim zdůvodňování umožňuje modelu lépe analyzovat složité úlohy, zatímco režim Ultra využívá subagenty k řešení ještě komplexnějších úloh. V oblasti programování GPT-5.6 Sol dosahuje nového maxima v benchmarku Terminal-Bench 2.1, který testuje schopnost modelu plánovat a koordinovat nejrůznější nástroje.
Nejvýraznější zlepšení přináší GPT-5.6 Sol v kybernetické bezpečnosti, což je paradoxně i problém. V benchmarku ExploitBench dosahuje výkon srovnatelný s Mythos Preview od Anthropicu, přičemž k tomu používá pouze třetinu výstupních tokenů. Právě toto přispělo k tomu, že je nový model jen omezeně dostupný stejně jako modely Fable 5 a Mythod 5. Než tak bude plně uvolněn, musí modely projít omezeným testováním. OpenAI sice s takovým omezováním moc nesouhlasí, ale řídí se jím.
Alex Stamos ze Stanfordu tvrdí, že tyto vládní zásahy brání USA v soutěži s Čínou v oblasti AI a že patrně nikdo v oblasti kybernetické bezpečnosti nevěří, že mají nějaký faktický rozumný základ. Anthropic, která se potýká s podobnými omezeními, dokonce podal žalobu proti vládě kvůli zákazu modelů Claude Fable 5 a Mythos 5.
OpenAI plánuje postupně rozšířit dostupnost GPT-5.6 Sol, Terra a Luna pro širší veřejnost v následujících týdnech, podle klasického rozvrhu postupného zavádění i toho, jak vůbec dostane možnosti je uvádět.