Відео: Маша и Медведь (Masha and The Bear) - Подкидыш (23 Серия) (Листопад 2024)
Хоча на щорічній конференції Hot Chips найбільше уваги отримують серверні мікросхеми, AMD та Intel використовували нагоду, щоб поговорити про чіпи, які вони випустили на початку року, надаючи трохи більше, ніж тизери про ще належні процесори.
До того, як конференція навіть офіційно розпочалася, AMD, Qualcomm та інші члени Альянсу гетерогенних систем (HSA) підштовхували майбутні специфікації HSA, розроблені для того, щоб SoC (система на мікросхемі) краще працював разом, з більш уніфікованою моделлю пам'яті. Спочатку це спрямовано на те, щоб графічні блоки (CPU) і процесорні графічні процесори (on-die) працювали більш уніфікованим способом, хоча підтримка інших типів прискорених процесорів прийде пізніше.
Зауважте, це дещо відрізняється від інших підходів, таких як Open CL Kronos Group або CUDA Nvidia, які розроблені для того, щоб допомогти керувати обчисленням GPU, але найчастіше використовуються з дискретної графікою.
Все-таки концепція дуже схожа, і справді багато інструментів та бібліотек, які підтримують такі речі, як Open CL, можуть бути адаптовані до HSA. Ідея полягає у спрощенні паралельного програмування як для ЦП, так і для GPU, використовуючи стандартні мови програмування. Наявність процесорів із усіма цими компонентами, що обмінюються пам'яткою з високою пропускною здатністю, - це гарний початок, але вони стають набагато кориснішими, оскільки розробники дійсно можуть ними скористатися.
AMD вже багато років говорить про концепцію HSA, а в компанії Hot Chips компанія провела деякий час, розмовляючи про чіпи, випущені на початку цього року, відомі як Kabini та Richland.
Kabini, який продається як E-серія та нижній кінець серії A, використовує чотирьохядерні «Jaguar» ядра x86, плюс архітектура Radeon HD 8000 Graphics Core Next (GCN). Компанія сказала, що це "налаштовує нас на неоднорідні обчислення". AMD заявив, що це дає їм більше ніж удвічі більшу продуктивність на ватт попереднього покоління (відомий як Онтаріо). Кабіні використовує 914 мільйонів транзисторів і вимірює 105 мм 2 для 28nm процесу.
Річленд, який складає деталі вищого класу серії A, є переробленою версією чіпа Trinity, який все ще виготовляється на 32-нм процесі. Ця мікросхема має два модулі з ядрами процесора Piledriver (кожен модуль має два цілих ядра та ділиться плаваючою комою та інші функції), кожен має 2 Мб спільного кешу L2 та графічний процесор Radeon HD 8000 серії DX11 з шістьма обчислювальними одиницями. Але в центрі уваги розмови було те, як AMD змогла покращити управління енергією.
Річленд додає датчики на витримку для вимірювання температури, додаткового стану підсилення, настроюваного TDP для OEM-виробників та "Інтелектуального підвищення", який визначає, чи навантаження на процесор, що працює на процесорі, чутлива до частоти. Якщо ні, Intelligent Boost може придушити процесор і забезпечити більше енергії для GPU для кращої загальної роботи системи. В цілому, AMD зазначає, що Річленд забезпечує на 29 відсотків кращу продуктивність процесора та 41 відсоток кращу продуктивність графічного процесора, ніж Trinity, і був на 51 відсоток ефективніший, ніж Trinity у відтворенні відео HD. В моїх власних тестах я виявив, що це все набагато повільніше в чистих завданнях процесора, ніж конкурентні мікросхеми Intel, але я не дуже зосередився на ресурсі акумулятора. Річленд не підтримує HSA - специфікація насправді не повна - але компанія заявила, що це "напевно, на 60 відсотків". Це буде замінено на початку наступного року на чіп, відомий як Kaveri, який повинен підтримувати більше можливостей HSA.
Що стосується Intel, то вона детальніше розповіла про лінійку процесорів Core 4-го покоління, відому як Haswell, яка почала доставку пару місяців тому. Це сімейство двоядерних та чотирьохядерних процесорів з різноманітними варіантами графіки, тепер включаючи версію із вбудованою DRAM для варіантів графіки найвищого класу.
Як і останні покоління, Haswell поєднує ядра процесора та GPU на єдиній мікросхемі з спільним кешем останнього рівня та підтримує стандартні API програмування, такі як OpenCL. Але деякі версії Core 4-го покоління з графікою Iris Pro також містять додаткові 128 Мб eDRAM в тому ж пакеті, хоча і на окремій матриці.
Більш великий кеш дозволяє системі пришвидшити існуючі завдання. Наприклад, GPU тепер може зберігати та повторно використовувати дані з кадру в кадр, щоб покращити продуктивність 3D-ігор. Хоча ядра CPU та GPU використовують однакові фізичні пули пам’яті, вони все ще використовують окремі вказівники або адреси віртуальної пам’яті, що відрізняє це від більш амбітного підходу Фонду HSA. Але здається справедливим сказати, що Intel спрямовується в тому ж загальному напрямку, щоб використовувати графічний процесор для більшої кількості обчислювальних робочих навантажень і полегшувати програмування з підтримкою останніх стандартів DirectX 11 і OpenCL.
Значна частина розмов стосувалася того, як Haswell краще займається управлінням енергією. Він має новий активний стан надзвичайно низької потужності (називається S0ix), призначений для того, щоб система збирала інформацію, використовуючи при цьому дуже мало енергії. І Haswell інтегрує велику кількість окремих регуляторів напруги, які були окремими компонентами в Ivy Bridge та попередніх поколінь.
Інші зміни включають в себе поліпшення обробки графіки та медіа, включаючи відтворення 4K відео та швидке синхронізацію відео з швидкістю від 4 до 12 разів у режимі реального часу. У самому ядрі є нові передбачення гілок та інші функції, а нові інструкції з обчислень включають AVX2, тоді як чіп додає підтримку транзакційної пам'яті для баз даних та високопродуктивних обчислень та кращої підтримки віртуалізації. Мої початкові тести на системах Haswell показали певне поліпшення продуктивності в реальних показниках, але основна новина тут здається, що це час автономної роботи, оскільки деякі системи, такі як MacBook Air, показали значні покращення.
Intel не говорила про Bay Trail, його майбутньому SoC для мобільних пристроїв. Можливо, він чекає наступного тижня на Форумі розробників Intel, але він детальніше розповів про свій Atom Z2580, смартфонну версію CloverTrail +. Сюди входять два ядра процесора Atom, а також двоядерна графіка (Power-VR SGX544MP2 технологій Imagination Technologies), контролер пам'яті та двигуни кодування та декодування відео. Порівняно з попереднім поколінням, відомим як Medfield, це перейшло від одноядерного / двопотокового процесора до двоядерного / чотирипотокового дизайну, а також покращило функції відтворення пам’яті, графіки, дисплея та низької потужності, включаючи нові держави управління енергією. В цілому Intel заявила, що це забезпечило двократне покращення продуктивності процесора та потрійне поліпшення графіки. (Орієнтовні цифри, особливо порівняно із системами ARM, були суперечливими.)
Я сподівався, що ми почуємо більше про Bay Trail від Intel - адже він повинен бути в системах доставки до сезону відпусток - і, можливо, про Kaveri від AMD. Але все ж, коли ви думаєте про зміни, що відбуваються на ринку процесорів - відхід від продуктивності як найважливіших критеріїв, а натомість більше уваги на енергоефективності та масштабованості - це був досить інтригуючий рік на ринку процесорів.