Zpět na článek

Diskuze: GPT-5 je fiasko, lidé chtějí zpět GPT-4o a jiné modely

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Derryk

Level

11. 8. 2025 18:20

Komentáře tohoto uživatele máš zablokované.

@Derryk Zajímavé. Mám opačnou zkušenost. Dělal jsem parsing z dat z lshw (z image Clonezilly více verzí takže struktura dat není jednotná) kvůli evidenci HW. Když jsem hodil všechny soubory z lshw cca 300 do wisebase, byl výsledek za chvíli hotov. Ale logicky bohužel bez názvů PC z názvů image ke kterým data patřila. Nebyl problém upravit vstupní info-lshw.txt, aby obsahovaly název PC z názvu image a výsledek byl perfektní. Ale problém byl, že jsem potřreboval prostředek, který by mohli používat i kolegové bez AI. Tedy formou Python scriptu. Za týden jsem s tím nebyl hotov. Starší verze lshw např. označovaly IDE disky jako zavěšené na scsi, stejně tak i USB disky použité na boot clonezilly a cílový disk. Navíc ani bod připojení disků není v různých verzích lshw stejně "hluboko" v hiearchii dat.
Ale možná to je netypický příklad.
Výstup extrakce přímo prostřednictvím LLM byl mnohem lepší. Např. socket CPU není vždy v LSHW uveden. LLM podle CPU a MB ten údaj dohledala a doplnila. Tuhle funkčnost dát do scriptu je nad mé schopnosti.

Jak byste dělal ty objednávky z Lidlu? Jedná se o 7 stránek a na každé je několik objednávek. V uložených html stránkách kvůli balastním informacím nebyla LLM schopna jednoznačně určit datum objednávky konkrétního kusu a kdsž ano, tak zase ne název zboží. Screenshot celé stránky do bitmapy také nebyl vhodný. Nakonec pomohlo prostě označit a zkopírovat text s objednávkami a ten předat LLM. Tady by možná bylo vhodnější ten text uložit a na něj vytvořit script.

Milan Šurkala

SHW

11. 8. 2025 19:02

Komentáře tohoto uživatele máš zablokované.

@Derryk Předpokládám, že v tom HTML bude vždy stejná struktura dat v objednávce (nebo několik málo, které lze snadno popsat, ideálně vždy s příkladem, ať LLM ví, co má hledat). LLM by měl být schopen udělat skript, který proleze zdrojový kód té stránky a vyseká z toho to, co potřebujete (sám jsem pár takových skriptů už s ChatGPT udělal). Je ale velký rozdíl udělat následující:

1, Říct LLM, ať to ze struktury vyseká a nechat ho to dělat na dalších datech (to zavání obrovským průšvihem a nenapadlo by mě to dělat tak nebezpečným způsobem - LLM by takto neměl pracovat s fakty/daty)
2, Říct LLM, ať to ze struktury vyseká a napíše k tomu skript, který ověříte, že funguje, přičemž to, co ládujete v bodě 1 do LLM, budete místo toho ve stejné formě ládovat do skriptu, který ten LLM vytvořil (LLM pracuje s konceptem řešení, ne s fakty/daty)

Zatímco přístup 1 je obsahový ("content") a dříve nebo později selže, protože LLM postupně pozapomene, co to vlastně dělá, přístup 2 ("concept") bude fungovat stále stejně a spolehlivě, protože spouštíte již hotový skript, který se nemění. Pokud se náhodou najdou data, která původní skript neumí zpracovat (nějaká jinak zadaná objednávka), dá se s pomocí LLM tento skript upravit (samozřejmě je potřeba to zkontrolovat, protože má občas tendenci rozbít to, co funguje - ideální nahrát mu původní verzi a říci, co v ní opravit), a pak to opět používat bez LLM.

Reklama

Diskuze: GPT-5 je fiasko, lidé chtějí zpět GPT-4o a jiné modely

Nejnovější komentáře

Nejčtenější obsah

Nejaktivnější čtenáři

Pokračujte ve čtení