Будинки Вперед мислення Великі зміни нарешті на горизонті для суперкомп'ютерів

Великі зміни нарешті на горизонті для суперкомп'ютерів

2024

Відео: Настя и сборник весёлых историй (Листопад 2024)

Озирнувшись на цьогорічній конференції ISC 17 щодо обчислювальних машин, схоже, що світ суперкомп'ютерів побачить кілька великих оновлень протягом наступних двох років, але оновлення до списку "Топ-500" найшвидших суперкомп'ютерів у світі, що двічі на рік, не сильно відрізнялося від попередня версія.

Найшвидшими у світі комп'ютерами продовжують залишатися дві масові китайські машини, які очолили цей список за кілька років: комп’ютер Sunway TaihuLight з Національного центру суперкомп'ютерів Китаю в Усі, з постійною продуктивністю Linpack понад 93 петафлопс (93 тис. Трлн. Плаваючої точки операції в секунду); і комп’ютер Tianhe-2 з Національного комп’ютерного центру суперкомп'ютерів в Китаї в Гуанчжоу, з стабільною продуктивністю більше 33, 8 петафлопсів. Вони залишаються найшвидшими машинами з величезним запасом.

Новий номер три - система Piz Daint від Швейцарського національного центру суперкомп'ютерів, система Cray, яка використовує Intel Ксеони та Nvidia Tesla P100s, яка нещодавно була модернізована, щоб забезпечити їй продуктивність Linpack з 19, 6 петафлопсом, що вдвічі перевищує її попередню. Це перемістило його з числа восьмого у списку.

Це опускає провідну систему США - систему "Титан" в Національній лабораторії "Оук-Рідж" - до четвертого місця, що робить це вперше за двадцять років, що в першій трійці немає системи США. Решта списку залишається незмінною, а на США все ще припадає п’ять із 10 найкращих, а Японія - дві.

Навіть якщо список найшвидших комп'ютерів не сильно змінився, в інших місцях є великі зміни. У списку Green 500 найбільш енергоефективних систем дев'ять із першої десятки змінилися. Зверху - система Tsubame 3.0, модифікована система HPE ICE XA в Токійському технологічному інституті, заснована на ядрі Xeon E5-2680v4 14, взаємозв'язку Omni-Path та Tesla P100 Nvidia, що дозволяє отримати 14, 1 гігафлопса на ват. Це величезний стрибок від Nvidia DGX Saturn V, заснований на платформі DGX-1 фірми та мікросхеми P100, який був номер один у листопадовому списку, але номер десять цього разу - 9, 5 гігафлопс / Вт. P100 входить у дев'ять перших десяти систем Green500.

Порушення 10 гігафлопс / ват - це велика справа, оскільки це означає, що гіпотетична система екзафлопу, побудована за сьогоднішньою технологією, споживає менше 100 мегават (МВт). Це все-таки занадто багато - ціль становить 20-30 МВт для системи екзафлоп, яку дослідники сподіваються побачити в найближчі п’ять років - але це величезний крок вперед.

Як і у списку "Топ-500", у подібних списках були лише незначні зміни з різними орієнтирами, наприклад, контрольний градієнт високої продуктивності (HPCG), де машини, як правило, бачать лише 1-10 відсотків своїх теоретичних пікових показників і де верхня частина Система - у цьому випадку машина Riken K - все ще доставляє менше 1 петафлопу. У цьому списку просунулися і системи TaihuLight, і Piz Daint. Коли дослідники говорять про машину екзафлопу, вони мають на увазі орієнтир Linpack, але HPCG може бути більш реалістичним з точки зору ефективності в реальному світі.

Виникнення обчислювачів GPU як прискорювач - майже завжди з використанням процесорів Nvidia GPU, таких як P100 - було найбільш помітною зміною в цих списках за останні роки, після чого було представлено власний прискорювач Intel, багатоядерний Xeon Phi (в т.ч. найсвіжіша версія Knights Landing). Поточний список Top 500 включає 91 систему, яка використовує прискорювачі або копроцесори, включаючи 74 з графічними процесорами Nvidia та 17 з Xeon Phi (ще три - з обома); один з процесором AMD Radeon як прискорювач і два, які використовують багатоядерний процесор японського постачальника PEZY Computing. Додаткові 13 систем зараз використовують Xeon Phi (Knights Landing) як основний блок обробки.

Але багато великих змін у суперкомп'ютерах все ще на горизонті, коли ми починаємо бачити більші системи, розроблені з урахуванням цих концепцій. Одним із прикладів є новий MareNostrum 4 в Барселонському центрі суперкомп'ютерів, який увійшов до списку Топ-500 під номером 13. Як це встановлено, це система Lenovo, заснована на майбутній версії Xeon Skylake-SP (офіційно Xeon Platinum 8160 24 -короткий процесор). Цікаво, що це три нові кластери "нової технології", заплановані на наступні пару років, включаючи один кластер з процесорами IBM Power 9 та графічними процесорами Nvidia, розроблений таким чином, щоб забезпечити максимальну потужність обробки понад 1, 5 Petaflops; другий, заснований на версії Xeon Phi на Knights Hill; і третій на основі 64-розрядних процесорів ARMv8, розроблених Fujitsu.

Ці поняття використовуються в ряді інших великих суперкомп'ютерних проектів, зокрема, декількох, які фінансуються Міністерством енергетики США в рамках співпраці CORAL в Національному лабораторії Дуб хребта, Аргонни та Лоуренса Лівермора. Першим на початку має стати Summit в Oak Ridge, який використовуватиме процесори IBM Power 9 та графічні процесори Nvidia Volta і планує поставити понад 150 до 300 пікових petaflops; Далі йде Сьєрра в Лоуренса Лівермора, яка планує забезпечити понад 100 пікових петафлопсів.

Тоді нам слід побачити суперкомп'ютер Aurora в Національній лабораторії Аргонни, заснований на версії Keghts Hill Xeon Phi та побудований Cray, який планує забезпечити 180 пікових петафлопсів. Системи CORAL повинні бути встановлені біг наступного року.

Тим часом китайські та японські групи також планували оновлення, в основному використовуючи унікальні архітектури. Слід цікаво спостерігати.

Ще більший зсув здається лише трохи далі: перехід до машинного навчання, як правило, на масово паралельних процесорних одиницях у самому процесорі. Хоча число Linpack відноситься до 64-бітної або подвійної точності продуктивності, існують класи додатків, включаючи багато додатків на основі глибоких нейронних мереж, які краще працюють при розрахунках з одно- або навіть напівточністю. Цим скористаються нові процесори, такі як нещодавнє оголошення Nvidia Volta V100 та нова версія Xeon Phi Knights Mill. На виставці Intel заявила, що версія, яка планується випустити у четвертому кварталі, матиме нові набори інструкцій для "низькоточних обчислень" під назвою Quad Fused Multiply Add (QFMA) та Quad Virtual Neural Network Instruction (QVNNI) .

Я припускаю, що ці концепції можуть бути застосовані і до інших архітектур, таких як Google TPU або FPGA та Intel чипи Nervana.

Навіть якщо ми цього року не побачимо великих змін, наступного року слід очікувати, що побачимо більше. Концепція машини для розгортання (1000 терафлопсів) все ще не видно, хоча це, ймовірно, спричинить ряд ще більших змін.