Intel má před sebou zřejmě nejdůležitější měsíce novodobé historie. Musí dohnat výkonnostní náskok konkurence, uvést svou první herní grafickou kartu a uspět s procesory, které budou odrazovým můstkem pro příští generace.
Po dlouhých letech se totiž v Santa Claře sešly najednou nový výrobní proces i zcela nová architektura CPU. Vlastně nikoliv jedna, ale hned dvě. A na jednom čipu. Firma na akci Architecture Day 2021 ukázala další detaily z kuchyně a snažila se škarohlídům vyvrátit některé mýty.
Alder Lake
Procesory Core 12. generace ponesou označení Alder Lake, to už jsme ale věděli. Firma dopředu prozradila také to, že čipy budou vyráběny vylepšeným 10nm procesem (mezitím přejmenovaným na „Intel 7“) a že v nich spojí jádra různých architektur. Jedna budou výkonná, druhá zase úsporná. Princip známý z armového světa jako big.Little si už Intel vyzkoušel u procesorů Lakefield, v nich kombinoval jedno výkonné a čtyři úsporná jádra. Alder Lake jich však bude mít několikrát tolik.
U desktopových čipů pro socket LGA1700 to bude až 8 výkonných a 8 úsporných jader, u notebookových pak 6+8 a ultramobilní čipy do tabletů a ultrabooků pak ponesou 2+8. Výkonná jádra využívají architekturu Golden Cove, úsporná pak Gracemont.
Golden Cove
Golden Cove zůstane u maximálního počtu osmi jader a šestnácti vláken díky hyperthreadingu jako předchozí Cypress Cove v současných procesorech Rocket Lake. Intelu se ale změnami v mikroarchitektuře podařilo zvýšit výkon (IPC) o 19 %.
Velký skok je průměrem z několika testů (SPEC CPU 2017, SYSmark 25, Crossmark, PCMark 10, WebXPRT3, Geekbench 5.4.1) a při normalizované frekvenci 3,3 GHz, kdy Golden Cove v nejlepších případech bude až o 60 % výkonnější, ale někdy dosáhne jen 90 % předchůdce. Za horšími výsledky nejspíš můžeme hledat deaktivované instrukce AVX-512 (fyzicky na čipu jsou).
A zvýšení? Intel upravil takřka všechny stavební bloky a tvrdí, že čipy jsou širší, hlubší a chytřejší. Zvětšil velikost všech možných bufferů, zlepšil predikci větvení, přidal páté ALU, zkrátil latence L1 cache a jako první mezi procesory typu x86 nabízí šest (místo čtyř) dekodérů instrukcí.
Gracemont
O jádrech -mont, které jsou základem procesorů Atom a enkových nebo jéčkových řad Pentií a Celeronů se mluví jako o pomalých nebo přinejlepším úsporných. Ty tam jsou ale doby mizerných netbooků rozdávaných k sekačkám v Mountieldu. Nové Atomy už mohou dosahovat výkonu, co před lety měla klasická velká jádra. Intel o nich proto mluví jako o efektivních.
Také v případě Gracemontu Intel výrazně upravil mikroarchitekturu. Zvětšil instrukční cache na dvojnásobných 64 kB, upravil prediktor větvení, přidal instrukční sady AVX, AVX2 a VNNI a má až dvakrát vyšší datovou propustnost oproti předchozímu Tremontu.
Výkon vzrostl tak, že se jej Intel nebojí srovnat s velkými jádry Skylake. Při stejné spotřebě prý Gracemont nabídne o 40 % více jednovláknového výkonu, případně při stejném výkonu by měl o 40 % nižší spotřebu. A ve srovnání se dvěma jádry Skylake (a čtyřmi vlákny) dokážou čtyři jádra Gracemont (bez HT, takže taktéž čtyři vlákna) dosáhnout při stejné spotřebě o 80% více výkonu nebo o 80 % nižší spotřeby při stejném výkonu (tedy pouze pětinová spotřeba Skylaku).
Intel výkon srovnání ve SPECrate2017_int_base, v jiných aplikacích mohou být rozdíl. Zakopaný pes ale bude hlavně v tom, že neznáme takty. Zatímco jádro Skylaku mohlo běžet v boostu až na 5 GHz (Core i9-9990XE), atomová jádra takto vysoko nikdy nejdou.
Řízení letového provozu
Intel ví, že plánovač procesů ve Windows není v ideální formě, nedokáže totiž pořádně využít vícejádrové čipy. Alder Lake přitom v maximální konfiguraci nabídne až 24 vláken (16 vláken na osmi jádrech Golden Cove, 8 vláken na 8 jádrech Gracemont). A navíc jeho jádra ani nejsou rovnocenná, takže by hrozilo, že náročné procesy by se počítaly na efektivních jádrech a naopak aplikace na pozadí by vytěžovaly výkonná jádra.
Aby se to nestalo, Intel už spolupracuje s Microsoftem na úpravě scheduleru pro Windows 11. Doufejme, že to budou obecné úpravy využitelné rovněž pro čipy od AMD, které nabízejí i více vláken. Intel však obětoval také kus křemíku na hardwarový scheduler, který nazývá Thread Director.
Jeho rolí tedy bude delegovat sekvence kódu těm správným jádrům, přičemž se v potaz vezme nejen výkon, ale i efektivita. Hlavně u notebooků a tabletů s horším chlazením by se například nemusela při vysoké zátěži (a teplotách) přiškrcovat velká jádra, ale výpočty by převzala ta malá.
S armovými čipy už výrobci mobilů i počítačů pochopili, že malá jádra mají z hlediska vyvážení výkonu a spotřeby smysl. Teď to chce Intel přinést i do světa x86. Věří totiž, že v běžném desktopu lidé nepotřebují hromadu velkých jader, které se většinu času flákají a i při té nečinnosti mají vyšší spotřebu. Malá jádra se zlomkovou spotřebou za ně mohou ty nenáročné úkoly převzít a ve vysoce paralelizovaných výpočtech zase pomůžou těm velkým.
To je mimochodem také důvod, proč Intel srovnal instrukční sady. Malá jádra tedy doplnil o AVX a AVX-2 a velkým naopak vypnul AVX-512. Architektura Golden Cove je bude využívat jen u serverových čipů, kde se hledí na co nejvyšší výkon, tudíž se tam nebudou „plést“ Gracemonty.
Další vychytávky a dostupnost
Alder Lake používá nové datové spoje. Propustnost komunikace mezi procesorovými jádry dosahuje 1000 GB/s, směrem k pamětem je to až 204 GB/s a k dalším vstupně-výstupním částem až 64 GB/s.
Procesory budou nově podporovat i paměti DDR5-4800 a LPDDR5-5200, zůstane ale také podpora DDR4-3200 a LPDDR4x-4266. Alder Lake poskytne 16 linek PCIe 5.0 a 4 linky PCIe 4.0. Nepůjde tedy současně naplno využít grafiku a SSD běžících na nové verzi PCI Expressu. Neměl by ale být problém uvolnit pro grafickou kartu jen osm linek a dva páry čtyřlinek nechat SSD. Grafické karty dnes neumí pořádně vytěžit ani PCIe 4.0, takže na co by jim byla dvojnásobná propustnost.
Intel počítá také s podporou Thunderboltu 4 a Wi-Fi 6E, avšak ty budou součástí leda tak mobilních čipů. U desktopu budou potřeba externí řadiče jako doposud. Mobilní SoC nabídnou i výkonnější integrovanou grafiku Xe s až 96 EU, zatímco desktopové modely budou mít jen 32 EU. K velkým počítačům si lidé budou muset přidat dedikovanou grafiku, třeba ty od Intelu (viz další kapitola).
Procesory Alder Lake a počítače na nich postavené by se měly začít prodávat ještě před koncem letošního roku. Čipy budou v TDP od 9 do 125 W, avšak to je už v případě Intelu jen silně orientační číslo. Konkrétní modely, přesné specifikace a ceny se dozvíme již brzy.
Arc Alchemist
Intel s grafickými čipy koketoval už od 80. let. Měl je na kartách, později na deskách v čipsetech, teď přímo v procesorech a opět už i na kartách. Letošní model DG1 byl jen nesmělým krůčkem bez jakýchkoli ambicí. To až DG2 ( architektura Xe-LP), nedávno přejmenovaný na Arc (Xe-HPG), má konečně oslovit i hráče.
Během Architecture Day 2021 toho Intel moc neprozradil. Jen zopakoval, že první generace nazvaná Alchemist dorazí v prvním čtvrtletí 2022 a že jeho nástupci ponesou označení Battlemage, Celestial a Druid. Almechist má nabídnout o polovinu vyšší frekvence než DG1 a má také o polovinu vyšší výkon na watt.
U Arcu již Intel nejmenší výpočetní jednotky neoznačuje jako EU. Místo toho má jádra Xe, každé s 16 vektorovými (256b) a 16 maticovými (1024b) enginy. Čtyři tzv. Xe-cores sdružuje do klastru Render slice, kde jsou i čtyři raytracingové akcelerátory, samplery, pixel backend a obvody pro rasterizaci a geometrii. Na diagramu pak vidíme až osm těchto Render Sliců sdílejících L2 cache.
Intel bude GPU vyrábět na 6nm procesu u TSMC (tedy už s využitím EUV), čímž předběhne AMD i Nvidii. Jestli je však dožene i výkonem, to zatím nevíme. Intel nechce ani naznačovat. Jen slibuje, že Arc bude plnohodnotnou herní kartou s plnou podporou DirextX 12 Ultimate, že nabídne vlastní AI upscaling XeSS, že zapracuje na ovladačích a že bude spoluprácovat s herním studii.
Alder Lake má vrátit Intel na procesorový trůn. Grafiky Arc začnou okopávat Radeony a GeForce - Živě.cz
Read More
No comments:
Post a Comment