Jeden z nejdéle očekávaných okamžiků světa IT posledních let je tady. Po letech střídavých superlativů a odkladů se Intelu podařilo vydat 10nm Xeony Ice Lake - první 10nm Xeony vůbec a zároveň první Xeony s post-Skylake architekturou. Čekání bylo opravdu dlouhé - připomeňme, že o generaci Ice Lake jsme psali už v roce 2015 a od roku 2017 o ní Intel mluvil zcela otevřeně / oficiálně / veřejně a vcelku pravidelně.
Čím dál, tím pravidelněji, ale ještě než k tomu došlo, promluvila o Ice Lake AMD. Bylo to v roce 2018, kdy se očekávalo, že vydání 10nm produktů Intelu - tedy Ice Lake - je na spadnutí a do pár měsíců dojde na nějaké ohlášení nebo roadmapy potvrzující termín vydání. Namísto toho se o slovo přihlásil Forrest Norrod ze serverové divize AMD a prohlásil, že druhou generaci procesorů Epyc (Rome, architektura Zen 2) postavili jako konkurenta pro 10nm Xeony Ice Lake, ale proti nim stát nakonec nebude. Tato slova byla jakousi studenou sprchou, neboť jimi Norrod z AMD nejen ohlásil zpoždění Xeonů Ice Lake, ale bylo jasné, že pokud má pravdu, tak jde o takové zpoždění, že během něj AMD připraví celou další generaci procesorů (Epyc Milan s architekturou Zen 3).
Intel poněkud neochotně a s použitím salámové metody připouštěl určité odklady - vždy, když se poslední avizovaný termín začal příliš blížit, unikla roadmapa posouvající vydání o kvartál, nebo o kvartál pozdější datum vydání zmínil nějaký pracovní tu na finanční konferenci, tam při prezentaci určené partnerům. Jednotlivé odklady už nemá smysl řešit, věnovali jsme se jim dostatečně. Sečteno podtrženo, Norrodova slova se po třech letech potvrzují. Xeon Ice Lake vychází měsíc poté, co byl Epyc Rome (Zen 2) nahrazen novým Epycem Milan (Zen 3), takže Rome za celou svoji éru konkurenci ze strany Ice Lake nezaznamenal.
Protože Intel uvedl přes 50 modelů Xeonů Ice Lake (až na výjimky se v tabulce neopakují), dovolím si ponechat specifikace ve slajdu (můžete si ho zvětšit až na 4k rozlišení). Podstatná informace oproti předchozím generacím je ta, že zatímco písmena za názvem u derivátů Skylake (L, M) specifikovala množství podporované paměti (při zachování ostatních parametrů), nyní mají vliv i na počet jader. Zatímco Xeon 8380 nese 40 jader, Xeon 8380H a 8380HL pouze 28 jader. První je určený pro 1-2socketové systémy, další dva jsou modely pro 4-8socketové systémy s vyšším boostem. Z pohledu počtu jader tak paradoxně 28jádrový Xeon 8380H(L) stojí víc než 40jádrový Xeon 8380.
Pro snazší orientaci v podpoře některých specifičtějších technologií na jednotlivých modelech (jsou uvedeny jen základní) ještě přikládám tabulku výše. Je tedy potřeba mít na paměti, že ne všechny Intelem uváděné prvky, technologie a fíčury jsou podporovány na všech modelech.
Přejděme k výkonu. Intel v prezentacích a podrobněji i na firemním webu zveřejnil řadu testů, podle kterých je Xeon Ice Lake v průměru asi o polovinu rychlejší než minulá generace Xeonů (což - jak uvidíte níže - více-méně odpovídá realitě) a v průměru o uváděných výsledků asi o stejnou polovinu rychlejší než nový Epyc Rome s jádry Zen 3 (což - jak uvidíte níže - není).
Srovnání Intelu má (v posledních letech už tradičně) různé háčky. Přiznávám, že jsem neprocházel všechny výsledky a popisy testovaných konfigurací a nastavení testů (je jich opravdu hodně), ale už při jejich zběžném přelétnutí jsem pár zádrhelů zaznamenal:
- Intel opakovaně srovnává Xeon za $8099 s Epycem za $6366 (když Xeon např. v LINPACK vychází jako o 18 % rychlejší než Epyc, vypadá to dobře, ovšem když člověk zjistí, že jde o model Xeonu o 27 % dražší, už to taková bomba není); AMD má v nabídce výkonnější Epyc za $7890
- Intel opakovaně srovnává 270W Xeon s úspornějším 225W modelem Epycu, kterému zvýšil TDP na 280W, aby to vypadalo jako srovnatelný produkt. Jenže úspornější model, který má z továrny nastaveny nižší takty, se pouhým zvýšením nepřetaktuje. AMD má přitom v nabídce modely s vyššími takty pro nativně 280W TDP.
- V testech Intelu je 69× „skloňováno“ počítání ve formátu INT8, který Xeon Ice Lake podporuje. V těchto testech je na Epycu použit formát FP32, tedy 4× přesnější desetinný namísto celočíselného. Můžeme konstatovat, že je věcí AMD, že formát INT8 používaný pro některé AI výpočty na úrovni procesorů nepodporuje. Ovšem jedním dechem je potřeba dodat, že x86 procesory nejsou zrovna nejefektivnějším nástrojem pro AI-výpočty a kde jde o vysoký výkon v INT8 (INT16, FP16…) se používají specializované akcelerátory, které dosahují o řád až dva vyššího výkonu za jednotku ceny. Zákazník, pro kterého je výkon pro AI klíčový, sáhne po akcelerátorech a nebude řešit, jestli je procesor pro tento účel 15× méně vhodný nebo 20× méně vhodný než akcelerátor. Tyto testy tak vypovídají o velmi okrajovém způsobu využití, který neodpovídá způsobu využití u většiny zákazníků.
Testy Intelu nebudeme dál rozebírat, podíváme se rovnou na první výsledky naměřené Anandtechem:
Grafy výše srovnávají nový Xeon 8380 (světle modře) a Epyc 7763 (oranžově). Pro ilustraci pozice dalších produktů je zahrnutý i tmavě modrý Xeon 8280 (14nm Cascade Lake s 28 jádry Skylake) a tmavošedě z ARM architektury vycházející Altra Q80-33, která na rozdíl od Xeonu skutečně působí jako konkurent Epycu - jednou je rychlejší, podruhé pomalejší, v průměru srovnatelná. V testech SPEC snad je s tou výtkou, že Altra sice cca v polovině testů Epyc překonává, ale ve druhé polovině občas výkonnostně padá na úroveň Ice Lake a místy i na úroveň 14nm Cascade Lake/Skylake.
Zpět k Ice Lake:
Souhrnné grafy ukazují, že Ice Lake je skutečně spíš konkurencí pro předchozí generaci Epyců (modely končící dvojkou), přičemž nová, trojková, je výš. Zde, v testech SPECint/fp2017, ve který AMD nikdy zrovna neexcelovala, je i 32jádrový Epyc 75F3 ($4860) s přehledem rychlejší než 40jádrový Xeon 8380 ($8099).
Anandtech přišel s velmi zajímavým testem, kde z výsledků testu, který zatěžuje všechna jádra (procesor se tedy chová jako při obvyklé zátěži) přepočte výkon na jedno jádro. Tento koncept testu má tu výhodu, že na rozdíl od testu spuštěného na jednom jádru není výsledek zkreslen nereálně vysokým jednojádrovým boostem, kterého při obvyklé zátěži procesor nedosahuje. Z testů tak vyplývá, že ať už jde o celkový výkon (Epyc 7763) nebo o výkon na jádro (Epyc 75F3), nabízí AMD podstatně výkonnější a cenově výhodnější řešení.
Závěrem můžeme ještě kouknout na test zaměřený na JAVU, které jsou příkladem situace, kde se novému Epycu daří o něco méně. Ne však o mnoho. V první grafu zaměřeném na maximální jOPS zůstává 32jádrový Epyc 75F3 v mírném závěsu za 40jádrovým Xeonem 8380, ale v druhém testu zaměřeném na kritické jOPS opět dopadá lépe.
Předloňský Epyc 7742 (Rome, Zen 2) zůstává nepokořen, letošní novinka rovněž a na konkurenci 40jádrovému modelu Intelu stačí 32jádrový model od AMD, který je podstatně levnější. Za Xeon oproti němu připlatíte $3239 / 67 % navíc.
Situaci docela kulantně uzavřel Anandtech, který konstatoval, že Xeony Ice Lake jsou zajímavé co do výkonnostního a technologické posunu oproti dosavadním 14nm Xeonům, ale ve srovnání s Epycy řeší pouze tu trapnou situaci, kdy jeden Epyc výkonnostně překonával dvojici Xeonů. K čemu se Anandtech nevyjádřil, jsou ceny v kontextu s výkonem, kde se zase až tak moc nemění - jednosocketové řešení od AMD nabízí 2× lepší poměr cena / výkon než dvousocketové od Intelu.
Intel se však díky Ice Lake může cítit méně trapně a zákazníci toto mohou brát jako ochutnávku a odrazový můstek pro odhady výkonu příští generace Xeonů Sapphire Rapids, která přinese podstatně zajímavější výkon.
Na závěr se můžeme pokochat pohledem na wafer Xeonů Ice Lake. Na jednotlivých čipech vidíte 17 dvojic jader. Další tři jádra samostatně jsou umístěna „nahoře“ a další tři „dole“, což dává celkem oněch 40. Ve článku nebylo zdůrazněno (ale v předchozích novinkách bylo mnohokrát řečeno), že Xeon Ice Lake je monolit, nejspíš poslední v serverových procesorech Intelu. 10nm proces Intelu definitivně ukázal, že tudy (velkými monolity) cesta nevede, což Intel stálo dva roky prodejů konkurenčního řešení (Epyc Rome).
Jednou z mála výhod monolitů je - v důsledku absence propojovacích rozhraní a nutnosti větších cache - nižší spotřeba křemíku. Teoreticky. Monolit Xeon Ice Lake se 40 jádry měří 660 mm². Čipletový Epyc Milan se 64 jádry dosahuje v součtu všech čipletů včetně centrálního 12nm nesoucího řadiče (8× 80,7 + 416 =) 1061,6 mm². Pro Ice Lake vychází 16,5 mm² křemíku na procesorové jádro, pro Milan vychází 16,59 mm² křemíku na procesorové jádro. Navzdory tomu, že AMD pro velkou část procesoru využívá velký 12nm čiplet, navzdory křemíku spotřebovanému na propojení (GMI rozhraní) a navzdory velkým cache pro eliminaci latencí propojek AMD nijak nezaostává ve spotřebě křemíku v přepočtu na jádro. Xeon Ice Lake je tak nejlepším možným důkazem toho, že monolitům odzvonilo - nepřinášejí hmatatelnou výhodu ani v tom ohledu, který by měl být jejich nejsilnější stránkou.
Po letech odkladů vydává Intel Xeony Ice Lake - Deep in IT
Read More
No comments:
Post a Comment