OpenAI uvolnilo open-weight modely GPT-OSS ve verzích 20B i 120B
Aktualita Robotika, AI Microsoft

OpenAI uvolnilo open-weight modely GPT-OSS ve verzích 20B i 120B

Milan Šurkala

Milan Šurkala

2

Po několika letech jsme se od OpenAI dočkali nových open-weight modelů. Ty si každý může stáhnout, použít i komerčně, přičemž lze vidět i více dovnitř modelu.

Reklama

Posledním open-weight modelem od OpenAI byl GPT-2 z roku 2019. Open-weight znamená, že jsou veřejně dostupné natrénované váhy (weights) modelu, umožňuje to tak si model stáhnout, analyzovat, vylepšovat, stavět na něm vlastní systémy. Není to ale open-source, a tak např. není přístup k samotnému trénovacímu algoritmu nebo trénovacím datům, na jejichž základě tyto váhy vznikly. Nyní společnost OpenAI zveřejnila dva nové modely GPT-OSS, a to gpt-oss-20b a gpt-oss-120b. Oba dva jsou dostupné pod licencí Apache 2.0 a dovolují tak vytváření výzkumných, ale i komerčních projektů. Navrženy jsou také pro agentovou práci (jako AI agenti), podporují zobrazení "přemýšlení", vyhledávání na webu i vykonávání kódu v Pythonu. Můžete také nastavit úroveň uvažování.

Varianta gpt-oss-120b je určena pro náročnější nasazení, má už dle svého názvu zhruba 120 miliard parametrů. Konkrétně je to 117 miliard a 5,1 mld. je aktivních. Na běh tohoto modelu potřebujete výkonný AI hardware, doma to tedy  většina z nás nespustí, chce to jednu kartu Nvidia H100 (resp. alespoň nějakých 60 GB RAM/VRAM). A to není běžný domácí hardware. Naproti tomu gpt-oss-20b má 21 miliard parametrů (3,6 mld. aktivních) a pro tento už potřebujete 16 GB paměti. A to už se najde na leckterém herním GPU a umožní běh lokálně na lepším herním PC nebo pracovním PC s lepším GPU. Podle Sama Altmana má výkon o4-mini a může běžet i na high-endovém laptopu (to ale vztahoval k většímu modelu, zatímco menší model prý běží na telefonu, čemuž se ale příčí informace o náročnosti ze samotných stránek s modely). Modely využívají nativní kvantizaci MXFP4 a 128K kontextové okno. Kdo chce, může si je vyzkoušet přes webové rozhraní na adrese gpt-oss.com. Ke stažení jsou pak např. na Hugging Face, stránku mají i na Githubu.

Zdroj: wccftech.com, techradar.com, openai.com, obrázek (ChatGPT)


Reklama
Reklama

Komentáře

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Reklama
Reklama