Zpět na článek

Diskuze: RTX 3060 Ti/SUPER by mohla nabídnout 4864 CUDA jader, více než TITAN RTX

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

JakubL
JakubL
Level Level
8. 9. 2020 13:13

Komentáře tohoto uživatele máš zablokované.

A jde skutečně o dvojnásobek CUDA jader? U Ampere nastala změna, že je místo FP32+int32 jednotky je FP32+FP32+? Co vím, tak stále neejsou známé detaily o architektuše, jestli byla celočíselná jednotka nahrazena nebo zachovánba - to by pak mělo vliv na výkon a na to, jak vypovídající je porovnávat počty jednotek Ampere/Turing ;)

Jan Vítek
Jan Vítek
Level Level
8. 9. 2020 13:30

Komentáře tohoto uživatele máš zablokované.

@JakubL Je to dvojnásobek CUDA jader pro FP32. Jde ale o to, že polovina z nich je určena také pro výpočty v INT32, takže nějaký počet bude vždy využit pro celočíselné operace, ale v případě zátěže využívající téměř pouze FP32 jádra to lze brát prostě tak, že jich tu máme dvojnásobek.

snajprik
snajprik
Level Level
8. 9. 2020 14:33

Komentáře tohoto uživatele máš zablokované.

@Jan Vítek Je to celkom zaujimave Take Ampere A100 za cenu od 12500€ ma len 19 TFLOPS v FP32 a ta 3080 za 700€ bude mať 30 TFLOPS v FP32 niečo tuna bude zle alebo vykon alebo cena :D alebo tie TFLOPS v FP32 niesu všetko?

JakubL
JakubL
Level Level
8. 9. 2020 14:50

Komentáře tohoto uživatele máš zablokované.

@Jan Vítek Tak A100 není myšlená na klasické FP výpočty, tam moc nevyniká. Její síla tkví v AI ;)

shaolin81
shaolin81
Level Level
8. 9. 2020 14:55

Komentáře tohoto uživatele máš zablokované.

@Jan Vítek A100 ma namiesto tych pridanych FP32 CUDA pridane FP64. Sice len polovicny pocet, ale to je normalne vzhladom na narocnost FP64.

shaolin81
shaolin81
Level Level
8. 9. 2020 13:36

Komentáře tohoto uživatele máš zablokované.

@JakubL Ako pisete, nie su rovnocenne a preto tvrdit, ze ich je viac ako v TITAN RTX nie je velmi fer.

Jan Vítek
Jan Vítek
Level Level
8. 9. 2020 13:41

Komentáře tohoto uživatele máš zablokované.

@shaolin81 Ale jsou rovnocenná. Záleží na způsobu využití. Kdyby nebyla rovnocenná, tak by nešlo psát o tom, že RTX 3080 nabídne výkon 30 TFLOPS v FP32.

shaolin81
shaolin81
Level Level
8. 9. 2020 13:44

Komentáře tohoto uživatele máš zablokované.

@shaolin81 A o kolko sa zdvihlo INT32??? Keby boli rovnocenne, zvidol by sa proporcn vykon v INT32 tiez.

Jan Vítek
Jan Vítek
Level Level
8. 9. 2020 13:57

Komentáře tohoto uživatele máš zablokované.

@shaolin81 Tak tady ale už záleží na definici. Pokud bereme CUDA jako jádra pro výkon v FP32, jsou rovnocenná. Pokud je bereme jako dvojici pro FP32 a INT32, rovnocenná nejsou.

JakubL
JakubL
Level Level
8. 9. 2020 14:28

Komentáře tohoto uživatele máš zablokované.

@shaolin81 Tak ony se i ty INT32 využijí ve hrách, jinak by je nVidia v minulosti nepřidala, tenkrát avizovala asi 30% výkonový nárust. Takže s Ampere sice máme 2x víc FP32 jednotek, ale část z nich musí při hraní vykonávat i INT32 výpočty, takže nelze čekat dvojnásobný herní výkon a to ani teoreticky. Proto je to porovnání počtu jednotek ošemetné ;)

shaolin81
shaolin81
Level Level
8. 9. 2020 14:56

Komentáře tohoto uživatele máš zablokované.

@shaolin81 Cize ste prave priznali a povedali, ze rovnocenne nie su.

Reklama
Reklama