YgriK
https://habr.com/ru/news/t/588554/
«Сбер» представил свой второй суперкомпьютер — Christofari Neo
- 1й на вольтах, 2й на амперах...
Главная iXBT.com Конференция Блоги Games Видео Market Prosound ПроБизнес Каталог Фото РегистрацияВойти | |
Treviz Зелёный флудер; КФ3ДВ 12023/62177 ответов 17 лет на iXBT, с мая 2007 Чаще пишет в "Флейм" (44%) Россия, Смоленск | YgriK https://habr.com/ru/news/t/588554/ «Сбер» представил свой второй суперкомпьютер — Christofari Neo - 1й на вольтах, 2й на амперах... |
vadim.it Member | YgriK https://habr.com/ru/news/t/588554/ «Сбер» представил свой второй суперкомпьютер — Christofari Neo на амперах... видосик огонь .. |
ansk Member 230/1209 ответов 11 лет на iXBT, с ноября 2013 Чаще пишет в "Процессоры" (66%) |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53268/57078 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | NVIDIA-BlueField-2X анонсированный осенью прошлого года https://www.servethehome.com/wp-content/uploads/2020…Cover-696x467.jpg Картинка отсюда https://www.servethehome.com/nvidia-bluefield-2-and-…ferings-launched/ NVIDIA A100X анонсированный щас https://3dnews.ru/assets/external/illustrations/2021…1/1053507/nv1.jpg Картинка отсюда https://servernews.ru/1053507 Модель A100X также имеет три мостика NVLink 3.0 для прямого подключения нескольких ускорителей друг к другу |
XSol Expert 4915/6249 ответов, #64 в рейтинге 16 лет на iXBT, с июля 2008 21 фото на iXBT.photo Чаще пишет в "Видеосистема" (79%) Россия, Москва | ansk Либо портируете, либо не запускаетесь на экзаскейле? Портирование будет заключаться в переписывании кода, поэтому да, многие будут просто использовать другие суперы. Уж не зелёным бухтеть про HPCG (слив и фуджикам и некам) Попридержи коней, ansk, с каких это пор мы с тобой на ты? Масштабирование зависит от интерконнекта, а там опций не так много и самые эффективные на сегодня - Инфинибанды последнего поколения от "зеленых". |
ansk Member 231/1210 ответов 11 лет на iXBT, с ноября 2013 Чаще пишет в "Процессоры" (66%) |
VLev Expert 3383/20655 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53269/57079 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | VLev А исходные данные есть? Для прогноза или гадания... В топ500 есть всего одна вега20 - https://www.top500.org/system/179801/ Щас она 376 Тут этой веги я не нашел нигде - https://www.hpcg-benchmark.org/ МИ100, которые в том году начала захватывать мир, также гдето спрятались. Как гадать? |
VLev Expert 3384/20657 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53270/57080 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | VLev Идём дальше... HPCG is a complete, stand-alone code that measures the performance of basic operations in a unified code: Sparse matrix-vector multiplication. Vector updates. Global dot products. Local symmetric Gauss-Seidel smoother. Sparse triangular solve (as part of the Gauss-Seidel smoother). Driven by multigrid preconditioned conjugate gradient algorithm that exercises the key kernels on a nested set of coarse grids. Reference implementation is written in C++ with MPI and OpenMP support. ТУТ 2 раза sparse. Это означает, что без поддержки в железе такому супер-компу ваще ничё не светит? |
VLev Expert 3385/20658 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | не, по факту любой супер может пройти тест в HPCG, а скорее всего скоро просто обязан будет. для top10 по крайней мере точно будут публиковаться Добавление от 12.11.2021 15:23: но для конкретности, можно сделать оценку для одного MI250, отдельно или в сравнении с A100Добавление от 12.11.2021 15:23: я потом всё пересчитаю и приведу к одному знаменателю |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53271/57081 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | Пройти-то может. Вопрос в процентах эффективности. А это и гпу, и контролеры памяти и интерконнект... наверняка еще чтото влияет. Ну и ктото из них главнее. Осталось узнать - где и что поискать Добавление от 12.11.2021 15:33: спец.процы и инфититибанд - в топахно неки их рвут Значит больше 10% мимимишка уже не даст идём дальше... Добавление от 12.11.2021 15:37: в самом низу - процы, тип интерконнекта не важен. Но иногда там есть и гпу.Значит 0.5...1% это вполне реально для любой новинки Чтоб дальше идти, надо вернуться - опять неясно что на что влияет и что искать. Т.е. 0.5%, 1%, 2%, 5% пока равновероятны. В 10% не верю ваще Хинт давай, а Добавление от 12.11.2021 15:49: Чисто китайская экзотика у плинтуса. Тогда 0.5% наверное можно убратьНуууу с натяжкой пусть будет так - 1%, 2%, 5% пока равновероятны А дальше всёравно надо знать что там в том алгоритме и чем иногда помогает гпу, спец.процы и интерконнект. В общем пришли в начало... Добавление от 12.11.2021 15:58: HPCG 3.1 Reference CodeAdded faster search for optimal 3D grid partitioning of a given integer that does not require combinatorial search through the all 3-set partitioning of the prime factors. - очень интересно, но совершенно не понятно для процентов, и на гпу-коде тоже HPCG 3.1 Binary for NVIDIA GPUs Including Volta This release contains additional optimizations that improve performance for SC17 runs. - ну вот... гпу, флопсы, кеши, ПСП, и тд и тп и др HPCG Publications - однозначно можно нарыть нюансы, но это надо чтото знать и уметь по конкретной тематике. |
VLev Expert 3386/20659 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53272/57082 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | НЕ напишет. Половину рисёча я уже провел и границы выставил. Вот еще... graphics processing unit accelerated supercomputers are also very effective for this type of workload. A comparison with other architectures is also presented, showing that graphics processing units, with their high memory bandwidth, are the highest performing devices for this new benchmark. Добавление от 12.11.2021 16:11: В принципе дальше надо копать конкретно гпу-нюансы. Если чё, то черновичек рассчетов ты знаешь где можно раньше времени засветить. А у меня через полчасика начинается другая пятница и рисёч уже не буду делатьПотом уже по твоим итогам напишу где я не туда свернул |
VLev Expert 3387/20660 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | скоро новый top500 опубликуют. Надеюсь, там все точки над ё будут расставлены |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53273/57083 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | Там Frontier точно будет? Может конечно еще чтото на МИ200 там засветиться, но не факт что оно в topHPCG будет |
VLev Expert 3388/20661 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow |
VLev Expert 3389/20662 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | всё, больше ждать не буду, привожу свою оценку. Учитывая в 1.5 раза худший машинный баланс и традиционные проблемы AMD с оптимизацией кода, прогоны оригинального (не жёстко оптимизированного) HPCG на MI200 дадут меньше 1% эффективности. Я даже 0.5% не удивлюсь особо. После оптимизации эффективность должна чуть-чуть превысить 1%, но до 1.5% скорее всего не дотянет никогда. Добавление от 14.11.2021 14:24: Тем не менее, для 2EFlops-ного суперкомпьютера даже такой низкой эффективности пока хватает для N1 в HPCG.Тут уже скорее надо интеловские GPU изучать на предмет эффективности. Исправлено: VLev, 14.11.2021 14:25 |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53275/57085 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | VLev Ну дай шанс не только амд с их hip/rocm, но и HPE/Cray |
Boris Usievich Member | Новый top500 уже есть |
Saturn TITAN RTX Pioneer, Ampere Pioneer 518/79250 ответов, #13 в рейтинге 22 года на iXBT, с ноября 2002 138 фото на iXBT.photo Чаще пишет в "Фото" (32%) США, California |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53302/57112 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | Обещанного на 21й год Frontier... нет Ничего на ми100 и ми200... нет Амд... надо немного подождать, как и всегда и во всём... пичалька Добавление от 16.11.2021 10:02: https://habr.com/ru/news/t/589411/Суперкомпьютеры «Яндекса» «Червоненкис», «Галушкин» и «Ляпунов» заняли 19, 36 и 40 место в рейтинге Top500 мира - эпики, амперы и меланоксы https://habr.com/ru/company/yandex/blog/589363/ Суперкомпьютеры Яндекса: взгляд изнутри - проблемы и решения тамже описаны Добавление от 16.11.2021 13:30: https://servernews.ru/1053761Atos и NVIDIA объявили о создании лаборатории Excellence AI Lab (EXAIL) и разработке экзафлопсных суперкомпьютеров на базе Arm-процессоров Grace https://servernews.ru/1053797 TOP500: уж ноябрь на дворе, а экзафлопса не видать - там еще всякая статистика есть |
VLev Expert 3390/20671 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53303/57113 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | VLev тут самым интересным было бы, если бы они попытались эти три супера в один объединить. Вот хуанг свои супер-компы по планете объединит в один облачный и доку с презанташкой всем разошлёт чё и как |
ansk Member 232/1214 ответов 11 лет на iXBT, с ноября 2013 Чаще пишет в "Процессоры" (66%) | https://www.nextplatform.com/2021/11/16/hpe-wins-another-european-hpc-center-with-cray-ex-plus-amd-compute/ 70-петафлопсник для французов, Epyc+Instinct, 2022 год, 1.6 MВт. Итого 1.4 пиковых экзафлопса (или ~1 реальный) укладываются в 32 МВт. |
VLev Expert 3391/20675 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | Китайский экзафлопсный суперкомпьютер окончательно похоронил миф о квантовом превосходстве Google Но нам важно понять, что именно это за экзафлопсы, а с этим туманно. В частности, в татье одновременно: Устоявшаяся производительность Oceanlite на 42 млн ядер или более составляет 1,05 Эфлопс, а пиковая — 1,3 Эфлопс (в HPL) и с устойчивой производительностью в 1,2 Эфлопс FP32 или 4,4 Эфлопс FP16 что немного взаимоисключающе. |
bess_temporary Member 27/12209 ответов, #86 в рейтинге 6 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. |
VLev Expert 3392/20676 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | да, пик 1.5EFlops на float |
VLev Expert 3393/20677 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | Немного поразбирался как устроены процессоры SW26010P из New Sunway Supercomputer. Основные параметры из статьи уже добавили в wiki, так что с этим повторяться не буду. Пиковая производительность приведена только на float, и она равна 14TFlops, что примерно соответствует RTX 3060 Ti. Пиковая ПСП (307.2GB/сек) в 1.5 раза хуже, а вместе с ней и машинный баланс. Собственно, эффективность в HPCG тоже большой не будет. Для даблов можно предположить пиковую вдвое меньше, т.е. 7TFlops. Если исходить из того, что ipc не поменялась по сравнению с предыдущей инкарнацией чипа, и составляет 8 DP FLOP на такт, то частота у меня получилась 2.25GHz. К сообщению приложены файлы: |
vlanko Member 78/537 ответов 9 лет на iXBT, с сентября 2015 Чаще пишет в "Процессоры" (73%) | Или она сделали чип ТОЛЬКО для FP32/16. |
bess_temporary Member 28/12232 ответов, #86 в рейтинге 6 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | Похоже на то. Хотя если всё же есть FP64, то всё равно до екзафлопса не дотянет - будет в пике 0.5-0.75. |
VLev Expert 3394/20679 ответов, #66 в рейтинге 22 года на iXBT, с января 2002 6 фото на iXBT.photo Чаще пишет в "Процессоры" (64%) Россия, Moscow | vlanko Или она сделали чип ТОЛЬКО для FP32/16. сомнительно, так как они это делали по программе Экзафлопса. bess_temporary Хотя если всё же есть FP64, то всё равно до екзафлопса не дотянет - будет в пике 0.5-0.75. добавят узлов -- это вопрос относительно небольших времени и денег. Добавление от 21.11.2021 14:22: да, у предыдущего SW26010 пиковая было 3TFlops на даблах.Увеличение за 3 года в 2.5 раза вполне себе реально. Особенно учитывая, за счёт чего именно: частота 1.45 -> 2.25 4 -> 6 кластеров CPEs всё это можно сделать за счёт использования более тонкого техпроцесса. |
YgriK Участник года 2010/2011, Флеймер года '2011-Н.В.' 53337/57147 ответов, #1 в рейтинге 23 года на iXBT, с января 2001 Чаще пишет в "Видеосистема" (94%) Web-страница | https://www.youtube.com/watch?v=Jj7o9iiy9qw A discussion covering Quda with AMD Instinct™ MI200 series accelerators on the Frontier supercomputer. Добавление от 22.11.2021 18:29: https://habr.com/ru/company/samsung/blog/590693/Samsung AI Forum 2021. День 1 |