Будинки Вперед мислення Суперкомп'ютер 15: більші зміни на горизонті

Суперкомп'ютер 15: більші зміни на горизонті

2024

Відео: Настя и сборник весёлых историй (Вересень 2024)

Коли я переглядаю анонси та розслідування минуломісячної конференції Supercomputing 15 (SC15) в Остіні, виявляється, що, хоча високоефективні обчислення можуть бути трохи затишними, це ринок, готовий до великих змін у році до прийти.

Якщо подивитися на лідерів у списку топ-500, що двічі на рік перераховує найшвидші у світі комп'ютери, лідером в шостий раз поспіль є Tianhe-2, суперкомп'ютер, побудований Національним університетом оборонних технологій Китаю. Відповідно до списку top500, ця машина забезпечує 33, 86 петафлоп / с (квадрильйони обчислень в секунду) стійкої продуктивності за показником Linpack і 54, 9 петафлоп / с теоретичної пікової продуктивності. Це засновано на процесорах Intel Xeon та Xeon Phi.

Друге місце продовжує займати Titan, система Cray XK7, заснована на процесорах AMD Opteron та графічних процесорах Nvidia K20x, встановлених в Національній лабораторії Oak Ridge DOE, зі швидкістю 17, 59 петафлоп / с за стійкою продуктивністю на еталоні Linpack.

Дві нові машини зламали топ-10. Комп'ютер Trinity в Національній лабораторії Лоуренса Лівермора (LLNL) займає шосте місце з 8, 1 петафлоп / с, тоді як система Hazel-Hen в німецькому Höchstleistungsrechenzentrum Stuttgart (HLRS) вийшла на восьме місце з 5, 6 петафлопа / с. Обидва - це машини Cray XC, засновані на процесорах Intel Xeon зі сполучним з'єднанням Aries.

Більші зміни відбуваються далі за списком, особливо при значному збільшенні кількості китайських систем, які зросли до 109, порівняно із лише 37 у попередньому списку. Частково, здається, це стосується більшості китайських систем, які працюють на еталонах та подають результати до списку. В результаті кількість американських систем знизилася з 231 до 200, що є найменшим числом з моменту створення списку в 1993 році; а кількість європейських систем знизилася зі 141 до 108.

Однією з великих тенденцій є збільшення кількості систем, що використовують прискорювачі або копроцесори, які піднялися до 104 систем у поточному списку, порівняно з 90 у липні. Більшість із цих систем використовують графічні процесори Nvidia Tesla, за ними йдуть копроцесори Xeon Phi від Intel, а декілька використовують комбінацію. Nvidia зазначив, що це було в 70 таких системах, у тому числі 23 з 24 нових систем у списку.

На виставці Nvidia підкреслила зростання прискорювачів, зокрема кількість прикладних програм, оптимізованих під архітектуру CUDA фірми. Компанія стверджує, що 90 відсотків топ-10 високоефективних обчислювальних програм і 70 відсотків перших 50 прискорені. Інтригуюче використання - для систем, що виконують симуляцію погоди, головного застосування для високоефективних обчислень, оскільки прогнози погоди розробляються різними урядами. Раніше Крей вказував на використання таких прискорювачів в Швейцарському бюро метеорології (MeteoSwiss) і розповів про те, як він працює з дослідниками Швейцарії, щоб переписати багато своїх застосувань. Зараз Nvidia вказує на використання прискорювачів Національною адміністрацією океанічної та атмосферної атмосфери (NOAA) для деяких своїх прогнозів погоди.

Серед інших застосувань, Крей рекламував додатки для нафти та газу, такі як використання 3D-геофізики для імітації водойми, а також фінансові послуги, такі як оцінка ризику. Такі програми рідко складають найшвидші системи у світі, але є свідченням того, що високоефективні обчислення займають більш широку роль у більшій кількості корпоративних програм. Крей розповів про постійне прогресування до впровадження великих і детальніших моделей у всіх наукових та інженерних дисциплінах, а також поєднання традиційних навантажень з аналітикою.

Мене також зацікавило оголошення Фундацією Linux про нові зусилля під назвою OpenHPC, призначені для створення більш відкритих стандартів у світі HPC. Це цікава ідея, і ця, здається, багато великих гравців підписується.

У роботі є ряд нових систем. IBM будує нову машину під назвою Summit в Національних лабораторіях Oak Ridge (ORNL) та іншу під назвою Sierra в Національній лабораторії Лоуренса Лівермора (LLNL), обидві на базі процесорів архітектури IBM Power, графічних процесорів Nvidia Tesla та Mellanox. Очікується, що саміт забезпечить від 150 до 300 пікових петафлоп / с, а Сьєрра - понад 100 петафлоп / с.

Крім того, Intel та Cray будують нову машину під назвою Aurora на базі майбутніх процесорів Intel Xeon Phi для Knights Hill для The Argonne Leadership Computing Facility (частина Argonne National Labs), яка спрямована на 150 петафлопів у 2018 році. Все це є частиною програми Міністерства енергетики, відомої як «Співпраця з дубового хребта», «Аргонна» та національних лабораторій Лоуренса Лівермора (CORAL), спрямованої на прискорення розвитку високоефективних обчислень, а саме проекту FastForward 2.

Тим не менш, нам ще належить пройти довгий шлях до "обширних обчислень".

Тим часом з'явилося кілька анонсів процесора, які могли б стати корисними для майбутнього. Nvidia, зокрема, підштовхнула використання суперкомп'ютерів для веб-додатків із високим масштабом, зокрема машинного навчання. Він оголосив про кілька продуктів нижчого класу: плата Tesla M40 з 3072 ядрами CUDA, яка, за її словами, була здатна виконувати до 7 одноточних терафлоп / с, спрямованих головним чином на "глибоке навчання", і M4, плата меншої потужності з 1024 ядрами та 2, 2 одноточним терафлопом / с, яка може бути використана для глибокого навчання, а також таких речей, як обробка зображень та відео. Крім того, компанія оголосила про новий "набір високомасштабних програм" із додатками, спрямованими на найбільші обчислювальні сайти. Обидва нові апаратні продукти базуються на 28nm технологічній технології та архітектурі Maxwell компанії.

Компанія анонсувала дві наступні архітектури, відомі як Pascal, що виходять у наступному році, і Volta, які будуть слідувати за нею. Intel зосередилась на тому, як HPC впливає на науку, і мене заінтригувало його опис того, як він використовує свій власний суперкомп'ютер - наразі 99 місце в топ-500 списку - для допомоги у розробці власних процесорів. Зокрема, компанія заявила, що використовує мільйон процесорних годин лише для розробки фотомасок для процесорів наступного покоління.

Значна частина діяльності Intel була зосереджена на Knights Landing, наступній версії чіпа Xeon Phi, який можна використовувати як прискорювач, але також завантажувати; і його тканина Omni-Path. Хоча Intel зараз каже, що загальна доступність буде в першій половині 2016 року, деякі клієнти мають ранній доступ до Knights Landing. В даний час Крей випробовує велику систему "Найт Ландінг", готуючись до доставки нового суперкомп'ютера під назвою "Корі" для Національного науково-обчислювального центру з енергетичних досліджень (NERSC) та Національної лабораторії Лос-Аламоса та Національної лабораторії Санді в наступному році. Bull, підрозділ французького системного інтегратора Atos, також отримав ранні версії Knights Landing для підготовки до системи Tera 1000, яку він будує для Французької комісії з альтернативної енергії та атомної енергії. Argonne Leadership Computing Facility працює над системою під назвою Theta, яка повинна надійти до наступного року, а Національна лабораторія Sandia працює з Penguin Computing над оновленням декількох систем, які використовують попередні покоління співпроцесорів Xeon Phi.

Раніше Intel заявляв, що будуть три різні версії Knights Landing: базовий хост-процесор (здатний самозавантажуватися), хост-процесор із інтегрованою тканиною Omni-Path та карта прискорювача PCIe. Сама мікросхема буде складатися з 36 плиток, кожна з двома ядрами процесора (загалом 72 ядра), чотирма векторними блоками обробки (два на ядро), 1 МБ спільного кешу L2 та кеш-агента для підтримки узгодженості; і Intel заявила, що вона повинна забезпечити приблизно втричі більшу кількість скалярних показників процесора Knights Corner, з подвійною точністю 3 терафлоп / с і піком одноосібної точності 6 терафлопів / с. Він також використовує нову систему пам'яті під назвою MCDRAM, вбудовану пам’ять із понад 3-кратною пропускною здатністю, порівняно з виходу на DDR4, що, здається, є варіантом архітектури гібридної пам’яті Cube, про яку розповідали Intel та Micron. На виставці у Cray була створена прототипна система із завантажувальною формою Knights Landing, а ряд інших виробників демонстрували системи, призначені для Knights Landing. Ця версія Xeon Phi планується дотримуватися версії під назвою Knights Hill, яка повинна будуватися на майбутньому 10-нм процесі.

Крім того, Fujitsu розповів трохи більше про свій проект Flagship 2020, заснований на новій мікросхемі, відомій як FX100 з 32 ядрами. Очікується, що це приблизно вчетверо збільшить показники з плаваючою точкою в порівнянні з поточним FX10, і, як Knights Landing, Fujitsu FX100 також буде використовувати версію архітектури Hybrid Memory Cube. Крім того, NEC має проект під кодовою назвою Aurora (не пов'язаний з проектом CORAL), заснований на його подальшому виконанні до мікросхеми SX-ACE, але з більшою пропускною здатністю пам'яті. Це орієнтоване на 2017 рік.