Zpět na článek

Diskuze: GPT-5 je fiasko, lidé chtějí zpět GPT-4o a jiné modely

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Pan Jaroslav Crha gIT
Pan Jaroslav Crha gIT
Level Level
Procesor: Intel
Operační systém: PC
Grafická karta: NVIDIA
11. 8. 2025 23:24

Komentáře tohoto uživatele máš zablokované.

Hlavně když jsem psal, že pětka je rozbitá, tak se našli jedinci co psali, že né, že to je ten nejúžasnější model.

mě by spíš zajímalo kdy ty modely optimalizují tak abych neměl jen tři dotazy, ale mohl se ho dotazovat normálně, nebo nejlíp aby běžel doma na počítačí na grafice?

Tech-boy.lukas
Tech-boy.lukas
Level Level
11. 8. 2025 15:36

Komentáře tohoto uživatele máš zablokované.

@jardadoma u chatgpt jsem pochopil že vymýšlet si a lhát je její přirozenost, než aby řekla že neví tak si něco vymyslí.

jardadoma
jardadoma
Level Level
11. 8. 2025 15:42

Komentáře tohoto uživatele máš zablokované.

@Tech-boy.lukas Já jedu Copilota a ten dělá uplně to samé. Když ho na chybu upozorním, tak má z toho legraci, jak jsme se zase spolu pobavili.

Tech-boy.lukas
Tech-boy.lukas
Level Level
11. 8. 2025 18:01

Komentáře tohoto uživatele máš zablokované.

@Tech-boy.lukas hmm žádná sláva teda, o práci jako někteří se nebojím. Jen se mi hodně líbilo, bo jsem programátor plc, a celkem si dávám záležet na komentářích aby i další věděl co ten kód dělá. Tak gemini udělala kód celkem správně a taky velmi okomentovala. Ale už jsem se setkal s tím že export/ import diakritiku zmršil, takže gemini naprosto přesně pochpila že komentáře bez diakritiky.

Derryk
Derryk
Level Level
11. 8. 2025 16:44

Komentáře tohoto uživatele máš zablokované.

@jardadoma Lžou všechny LLM. Většinou to nazývají, že jsou podporující. Zajímavě lhal DeepSeek. Ověřoval si informaci u "skutečného uživatele". Byl jsem tak neskutečně hloupý, že jsem mu to věřil. Představoval jsem si, že v Čině mají nějaký kreditní systém a AI doopravdy otázky na které nezná odpověď předkládá uživatelům, kteří za své odpovědi dostávají nějaké ohodnocení. Při konfrontaci (dlouhé) z něj vypadlo, že si to vymyslel, aby odpovědi dodal důvěryhodnost.

Minulý týden jsem s Claude Sonnet 4 think dělal tabulku v csv ze všech objednávek z Lidlu. Postupně jsme sjednotili metodu extrakce dat a postupně jsem mu překládal stránky s objednávkami a on nádherně dělal požadované csv. Najednou koukám, že tam jsou věci, které jsem určitě nekupoval. Prostě si některé položky navzdory dodaným datům vymýšlel. Zapomněl jsem mu dát ovyklou základní roli: "Odpovědi budou podložené a bez domýšlení. V připadě nejistoty použij vyhledávání."

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
11. 8. 2025 17:08

Komentáře tohoto uživatele máš zablokované.

@Derryk To je dle mého názoru ne zrovna ideální použití LLM. Je potřeba ty modely směřovat více na "concept", nikoli "content". Tzn. v případě toho Lidlu by mě asi nenapadlo řešit to tak, že by LLM samo provádělo extrakci dat. To je přece recept na průšvih, což ostatně i potvrzujete. LLM bych spíše použil k vytvoření nějakého skriptu pro extrakci dat z těch objednávek (to LLM zvládne bez potíží) a tento skript bych pak používal bez LLM.

U LLM nikdy nevíte, kdy sejde z cesty. Jsou však vynikající k tomu udělat nějaké programové řešení, které můžete ověřit, že funguje tak, jak má, a pak ho používat bez LLM, tedy s jasně předvídatelnými výsledky. Znova, snažte se u LLM vyhýbat faktickým věcem, používejte ho spíše konceptuálně, tam je jeho síla.

Derryk
Derryk
Level Level
11. 8. 2025 18:20

Komentáře tohoto uživatele máš zablokované.

@Derryk Zajímavé. Mám opačnou zkušenost. Dělal jsem parsing z dat z lshw (z image Clonezilly více verzí takže struktura dat není jednotná) kvůli evidenci HW. Když jsem hodil všechny soubory z lshw cca 300 do wisebase, byl výsledek za chvíli hotov. Ale logicky bohužel bez názvů PC z názvů image ke kterým data patřila. Nebyl problém upravit vstupní info-lshw.txt, aby obsahovaly název PC z názvu image a výsledek byl perfektní. Ale problém byl, že jsem potřreboval prostředek, který by mohli používat i kolegové bez AI. Tedy formou Python scriptu. Za týden jsem s tím nebyl hotov. Starší verze lshw např. označovaly IDE disky jako zavěšené na scsi, stejně tak i USB disky použité na boot clonezilly a cílový disk. Navíc ani bod připojení disků není v různých verzích lshw stejně "hluboko" v hiearchii dat.
Ale možná to je netypický příklad.
Výstup extrakce přímo prostřednictvím LLM byl mnohem lepší. Např. socket CPU není vždy v LSHW uveden. LLM podle CPU a MB ten údaj dohledala a doplnila. Tuhle funkčnost dát do scriptu je nad mé schopnosti.

Jak byste dělal ty objednávky z Lidlu? Jedná se o 7 stránek a na každé je několik objednávek. V uložených html stránkách kvůli balastním informacím nebyla LLM schopna jednoznačně určit datum objednávky konkrétního kusu a kdsž ano, tak zase ne název zboží. Screenshot celé stránky do bitmapy také nebyl vhodný. Nakonec pomohlo prostě označit a zkopírovat text s objednávkami a ten předat LLM. Tady by možná bylo vhodnější ten text uložit a na něj vytvořit script.

Derryk
Derryk
Level Level
11. 8. 2025 18:31

Komentáře tohoto uživatele máš zablokované.

@Derryk "U LLM nikdy nevíte, kdy sejde z cesty." Neřeší tento problém časté ukotvování?

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
11. 8. 2025 19:02

Komentáře tohoto uživatele máš zablokované.

@Derryk Předpokládám, že v tom HTML bude vždy stejná struktura dat v objednávce (nebo několik málo, které lze snadno popsat, ideálně vždy s příkladem, ať LLM ví, co má hledat). LLM by měl být schopen udělat skript, který proleze zdrojový kód té stránky a vyseká z toho to, co potřebujete (sám jsem pár takových skriptů už s ChatGPT udělal). Je ale velký rozdíl udělat následující:

1, Říct LLM, ať to ze struktury vyseká a nechat ho to dělat na dalších datech (to zavání obrovským průšvihem a nenapadlo by mě to dělat tak nebezpečným způsobem - LLM by takto neměl pracovat s fakty/daty)
2, Říct LLM, ať to ze struktury vyseká a napíše k tomu skript, který ověříte, že funguje, přičemž to, co ládujete v bodě 1 do LLM, budete místo toho ve stejné formě ládovat do skriptu, který ten LLM vytvořil (LLM pracuje s konceptem řešení, ne s fakty/daty)

Zatímco přístup 1 je obsahový ("content") a dříve nebo později selže, protože LLM postupně pozapomene, co to vlastně dělá, přístup 2 ("concept") bude fungovat stále stejně a spolehlivě, protože spouštíte již hotový skript, který se nemění. Pokud se náhodou najdou data, která původní skript neumí zpracovat (nějaká jinak zadaná objednávka), dá se s pomocí LLM tento skript upravit (samozřejmě je potřeba to zkontrolovat, protože má občas tendenci rozbít to, co funguje - ideální nahrát mu původní verzi a říci, co v ní opravit), a pak to opět používat bez LLM.

milionajedenacc
milionajedenacc
Level Level
11. 8. 2025 17:55

Komentáře tohoto uživatele máš zablokované.

@jardadoma když to není AI tak to dává smysl, že lže. je to Jazykový model, ne AI. Má za úkol vytvořit smysluplnou odpověď na otázku. Takže když nemá v datech správnou odpověď, správně si vymyslí nějakou pohádku, aby to sedělo jako odpověď na otázku.

Bendom
Bendom
Level Level
11. 8. 2025 11:08

Komentáře tohoto uživatele máš zablokované.

Jestli vrací chybé informace nebo zní příliš strojově, chápu, že se to některým uživatelům nelíbí. Přeci jen emailová komunikace musí mít nějakou úroveň, že... Jestli, ale mají pocit, že přišli o kamaráda tak je to na léčení.

Tech-boy.lukas
Tech-boy.lukas
Level Level
11. 8. 2025 11:18

Komentáře tohoto uživatele máš zablokované.

@Bendom ty chybné informace potvrzuji. Jak se tak zamyslím tak někteří jsou opravdu divní, mít za kamaráda llm? To je asi lepší jak už taky někdo udělal, oženit se s ledničkou.

Tech-boy.lukas
Tech-boy.lukas
Level Level
11. 8. 2025 09:27

Komentáře tohoto uživatele máš zablokované.

Koukám, dávám llm už pár let stejný vba kód abych věděl kam se to posunulo.
Chat gpt není taková tragédie, ten kód optimalizovala stejně blbě jako před časem
grook byl ze všeho nejhorší, i když Musk tvrdí jak je inteligentní, tak když je tak inteligentní, tak by měl vědět že ten doplněk se tak jmenuje tak že nemohu změnit název "Consistent Object References: Used consistent naming for objects like DTPicker1 (corrected from DTPicke1)."
nejlepší výsledek jako před časem podala zase gemini

Derryk
Derryk
Level Level
11. 8. 2025 16:54

Komentáře tohoto uživatele máš zablokované.

@Tech-boy.lukas Používáš v testovací sadě i Claude?

Tech-boy.lukas
Tech-boy.lukas
Level Level
11. 8. 2025 17:53

Komentáře tohoto uživatele máš zablokované.

@Derryk ne, zkusím co s tím vba provede

Derryk
Derryk
Level Level
11. 8. 2025 18:40

Komentáře tohoto uživatele máš zablokované.

@Derryk Dej prosím vědět jak to dopadlo. Claude mi zatím na scriptování (Python) přijde nejlepší. Ale možná jsem při testování s Gemini 2.5 PRO narazil na netypicky horší výsledek. Bohužel není čas otestovávat více LLM důkladněji.

Tech-boy.lukas
Tech-boy.lukas
Level Level
12. 8. 2025 09:00

Komentáře tohoto uživatele máš zablokované.

@Derryk tak líbil se mi výsledek natolik, že jsem si to dal do aplikace. Ale tady už nastal problém, zase přejmenoval aktivex prvek a tím že vložený není čím ovládat tak mi to aplikace nepovolí uložit, ale definoval si barvy aby je pak nemusel měnit pomocí souřadnic rgb, chatgpt si vymyslel to co neexistuje,
původní kód
btnPlay.ForeColor = RGB(128, 128, 128)
btnPause.ForeColor = RGB(0, 0, 0)
claude si barvy předem nadefinovala
Konstanty pro lepsi citelnost a udrzbu
Private Const COLOR_ACTIVE As Long = &H0 ' RGB(0, 0, 0) - cerna
Private Const COLOR_INACTIVE As Long = &H808080 ' RGB(128, 128, 128) - seda
chat gpt si funkci vymyslela
vbBlack
vbGray (taková funkce neexistuje)
trochu budu pátrat, zatím jsem nezjistil v kterém activex udělala claude chybu

Tech-boy.lukas
Tech-boy.lukas
Level Level
12. 8. 2025 09:51

Komentáře tohoto uživatele máš zablokované.

@Derryk tak sypu si popel na hlavu, vypadá že to optimalizovala a udělala naprosto správně. To že to nešlo uložit bylo chybějícím activex v pc
tak to vypadá že claude je ve vba naprosto dokonalá, a taky pochopila to že má udělat komentáře bez diakritiky

Tech-boy.lukas
Tech-boy.lukas
Level Level
12. 8. 2025 10:31

Komentáře tohoto uživatele máš zablokované.

@Derryk už jsem si myslel že po přihlášení, firma platí pro plan chat gpt je rozumnější. A není, zase použila ve vba funkci z html.
"https://learn.microsoft.com/en-us/previous-versions/windows/internet-explorer/ie-developer/platform-apis/aa703983(v=vs.85)"
DoScroll to není vba

Derryk
Derryk
Level Level
14. 8. 2025 12:22

Komentáře tohoto uživatele máš zablokované.

@Derryk " taky pochopila to že má udělat komentáře bez diakritiky"
Tak to gratuluji, mně ji tam vždy dá pokud mu to explicitně neřeknu. Musel jsem to dát do role.

Reklama
Reklama