Продолжение темы здесь
Страницы:Кликните, чтобы указать произвольную страницуназад1233132333435363738394041172173174далее
Cheetah X-15: Процессоры Intel Alder Lake LGA1700 (на архитектурах Golden Cove / Gracemont)
Forzay
unregistered
F
Forzay unregistered
3 года назад / 06 сентября 2021 10:30
Omega
"один переезд равен двум пожарам".
Не так. В поговорке о равенстве двух переездов и одного пожара.
s0rr0w
Member
4535/4802 ответов
20 лет на iXBT, с января 2005
Чаще пишет в "Процессоры" (94%)
Инфо
s
s0rr0w Member
3 года назад / 06 сентября 2021 11:52
Omega
слишком часто перекидывать треды по ядрам ещё вредней, чем вообще не перекидывать

А кто говорил про "чаще"? Эффективнее не равно чаще. Например, две задачи при слабой нагрузке лучше раскидывать на самые холодные ядра, чтобы буст был как можно лучше. Но если проц нагрет уже и на всех ядрах уже есть нагрузка, то можно догрузить самое горячее ядро, чтобы остальные остыли. Звучит нелогично с первого взгляда, но горячее ядро уже имеет максимальную температуру, поэтому там будет базовая частота или около того. Остальные ядра остынут, что даст возможность ядру, которое все еще загружено, бустить. Задача закончится раньше.

На малых ядрах переезд может быть эффективным, если перебрасывать задачу на ядра с одним L2. Эффективность переезда можна улучшить, если заблаговременно начать миграцию кэша в соседний L3 больших ядер из L2 малых, а уже потом говорить OS, перекинь тред с такого-то ядра на такое, все готово уже. Короче, вангую более сложные механизмы управления тредами, чем это есть сейчас.
bess_temporary
Advanced Member
11074/11191 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 11:59
s0rr0w

> в соседний L3

Не знаю, что вы имели в виду, но соседних L3-кэшей не существует. Весь L3 общий.
Boris Usievich
Member
19649/47068 ответов, #6 в рейтинге
22 года на iXBT, с октября 2002
Чаще пишет в "Процессоры" (44%)
Инфо
B
Boris Usievich Member
3 года назад / 06 сентября 2021 12:02
s0rr0w
при слабой нагрузке
....
там будет базовая частота
не бывает.

Эффективность переезда можна улучшить, если заблаговременно начать миграцию кэша в соседний L3 больших ядер из L2 малых
чушь. L3 общий.
Raytracer77
Member
23137/47051 ответов, #35 в рейтинге
12 лет на iXBT, с августа 2012
Чаще пишет в "Процессоры" (41%)
Россия, Новороссийск-Москва
Инфо
Raytracer77 Member
3 года назад / 06 сентября 2021 12:11
Boris Usievich
L3 общий.
ога, только на райзенах скорость доступа к нему из разных CCX не равномерна
bess_temporary
Advanced Member
11075/11192 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 12:18
В "Зене-2" оно вовсе не общий. Как, естественно, и между кристаллами "Зена-3".
Boris Usievich
Member
19651/47071 ответов, #6 в рейтинге
22 года на iXBT, с октября 2002
Чаще пишет в "Процессоры" (44%)
Инфо
B
Boris Usievich Member
3 года назад / 06 сентября 2021 12:31
Raytracer77
Мы вроде в ветке про alder lake, причем тут вообще zen?
Omega
Member
4016/5024 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо
O
Omega Member
3 года назад / 06 сентября 2021 14:06
Forzay
>Не так. В поговорке о равенстве двух переездов и одного пожара.

ходят оба варианта, это просто разная степень преувеличения последствий переезда. 1=1/2 пожара, скорее про материальные потери(разбитая посуда, поврежденная мебель), а 1=2 пожара скорее про моральные\социальные потери от переезда, от смены привычного окружения
.

s0rr0w
Но если проц нагрет уже и на всех ядрах уже есть нагрузка, то можно догрузить самое горячее ядро, чтобы остальные остыли. Звучит нелогично с первого взгляда, но горячее ядро уже имеет максимальную температуру, поэтому там будет базовая частота или около того.
по сути вы описываете грубый вариант троттлига\скейлинга на уровне ядер с сильно заметными колебаниями производительности, что во первых не понравятся приложениям, которые чувствительны к задержкам. Снизим общую производительность в надежде, что потом в сумме догоним кол-во инструкций, за счет большего буста у "остывших" ядер. А если ваша задача закончится в момент, когда вы будете тротлить\остывать, скинув несколько тредов на одно ядро?
Основная же идея буста как раз обратная, давайте попробуем как можно быстрее завершить задачу, за счет максимальной частоты\вольтажа, а если не получилось завершить за краткое, но ещё безопасное время, то так и быть, уменьшим частоту/вольтаж до безопасной температуры\мощности за длительный период.
bess_temporary
Advanced Member
11082/11199 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 14:14
Надо иметь в виду, что все эти алгоритмы нужны только тогда, когда число активных потоков заметно меньше числа (виртуальных) ядер. И иногда, когда их заметно больше (впрочем, не уверен).

Если же число потоков равно числу ядер (или несколько меньше), то всё будет работать либо само собой, либо в соответствии с привязкой потоков к ядрам и с алгоритмом параллельной программы (набора программ).

Поэтому в моём плане тестирования нет вопросов к этому директору. Хотя его тоже можно было бы потестировать
Omega
Member
4017/5025 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо
O
Omega Member
3 года назад / 06 сентября 2021 14:23
>базовая частота

это вообще уже маркетинговый термин. Процы живут в бусте от мин до макс. буста. Снижение базовой частоты может быть и положительным признаком, просто означать, что проц на этой частоте имеет достаточно производительности для поддержки интерактивной среды.
s0rr0w
Member
4536/4803 ответов
20 лет на iXBT, с января 2005
Чаще пишет в "Процессоры" (94%)
Инфо
s
s0rr0w Member
3 года назад / 06 сентября 2021 14:42
bess_temporary

Не знаю, что вы имели в виду, но соседних L3-кэшей не существует. Весь L3 общий.
Ага, на схеме вижу, что у кластера слабых ядер таки на схеме есть L3. Ошибочка вышла, я думал, что у них только L2.

Добавление от 06.09.2021 14:42:

Boris Usievich

не бывает.
Читаем внимательно написанное, а не вырываем из контекста отдельные фразы и потом делаем многозначительные выводы.
SlaveN_VM
Member
1872/3344 ответов
17 лет на iXBT, с января 2008
Чаще пишет в "Процессоры" (52%)
Россия, Москва
Web-страница
Инфо
SlaveN_VM Member
3 года назад / 06 сентября 2021 14:47
Omega
означать, проц на этой частоте имеет достаточно производительности для поддержки интерактивной среды

Не означает. Процессоры Интел (и АМД) умеют снижать частоту сильно ниже базовой, "для интерактивной среды" может быть и 800 МГц, и ниже.

Насколько я понимаю, базовая тактовая частота - это то, что производитель гарантирует в заданном ТДП при любых (паспортных) условиях эксплуатации. То есть написано "TDP 125 Вт, температура окружающей среды до 40 градусов" - значит, при полной нагрузке на AVX, при любом кулере под этот ТДП и при указанной температуре в помещении проц должен держать базовую ТЧ, не скатываясь в троттлинг.

Исправлено: SlaveN_VM, 06.09.2021 14:50

s0rr0w
Member
4537/4804 ответов
20 лет на iXBT, с января 2005
Чаще пишет в "Процессоры" (94%)
Инфо
s
s0rr0w Member
3 года назад / 06 сентября 2021 14:50
Omega
давайте попробуем как можно быстрее завершить задачу
В подходе big.LITTLE это может не работать как хочется. Буст энергоэффективных ядер меньше, чем производительных. Для идеального ускорения придется сначала перемещать процессы. Но снова же, не факт что буст и возможен при постоянно высокой нагрузке.
Boris Usievich
Member
19656/47078 ответов, #6 в рейтинге
22 года на iXBT, с октября 2002
Чаще пишет в "Процессоры" (44%)
Инфо
B
Boris Usievich Member
3 года назад / 06 сентября 2021 14:51
s0rr0w
Ага, на схеме вижу, что у кластера слабых ядер таки на схеме есть L3. Ошибочка вышла, я думал, что у них только L2.
вы по прежнему видите не то. Для всех ядер доступен весь L3
bess_temporary
Advanced Member
11086/11203 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 14:51
s0rr0w

> Ага, на схеме вижу, что у кластера слабых ядер таки на схеме есть L3

Не совсем так. У них нет своего L3. У них, как и у больших ядер, на узле кольцевой шины есть такой же сегмент L3-кэша. И все эти сегменты равномерно делятся по адресам, образуя общий однородный L3-кэш.

Подозреваю, что размер кластера малых ядер всё-таки больше, чем размер большого ядра.

Что же касается 1/4 потребления для 1/2 производительности (от большого ядра), этого, кажется, достигнуть нетрудно. Достаточно просто подсчитывается.
Omega
Member
4018/5026 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо
O
Omega Member
3 года назад / 06 сентября 2021 14:56
SlaveN_VM
потому базовую частоту назначает "технический маркетинг", проводя опросы на какой частоте у конкретного проца пользователи оболочки современных ОС, и набора популярного ПО, чаще начинают жаловаться на тормоза....
при полной нагрузке на AVX, при любом кулере под этот ТДП и при указанной температуре в помещении проц должен держать базовую ТЧ, не скатываясь в троттлинг.
The processor base frequency is the operating point where TDP is defined

далее смотрим как назначается TDP....

Thermal Design Power (TDP) represents the average power, in watts, the processor dissipates when operating at Base Frequency with all cores active under an Intel-defined, high-complexity workload.

далее смотрим, что такое

Intel-defined, high-complexity workload...

However, during turbo or certain workload types such as Intel® Advanced Vector Extensions (Intel® AVX) it can exceed the maximum TDP but only for a limited time , or

Until the processor hits a thermal throttle temperature, or
Until the processor hits a power delivery limit.

и оказывается, что код с AVX может превышать TDP, значит такой нагрузкой не является.

Исправлено: Omega, 06.09.2021 15:54

bess_temporary
Advanced Member
11088/11205 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 17:35
Код может превышать TDP, если система охлаждения позволяет отводить тепло. Таким образом, экстремальное тепловыделение есть свойство среды, окружающей процессор. Ну и свойство выносливости процессора, конечно

Ну и напомню, что для AVX/AVX2 приводятся другие базовые частоты.
Omega
Member
4019/5027 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо
O
Omega Member
3 года назад / 06 сентября 2021 17:51
>Ну и напомню, что для AVX/AVX2 приводятся другие базовые частоты.

которых никто в маркетинговых материалах на коробках не пишет.
bess_temporary
Advanced Member
11089/11206 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 18:04
Тот, кто читает маркетинговые материалы на коробках, не использует AVX
matik
Expert
20284/41924 ответов, #7 в рейтинге
23 года на iXBT, с марта 2001
Чаще пишет в "Процессоры" (52%)
Инфо
m
matik Expert
3 года назад / 06 сентября 2021 18:18
Omega
которых никто в маркетинговых материалах на коробках не пишет.
Их и в технической документации не так-то просто разыскать
Для Xeon-ов они не в самой документации, а в specification update, которые хрен просто так разыщешь, если нет подписанного NDA.
bess_temporary
Advanced Member
11092/11209 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 18:25
matik

Не, всегда скачивались без NDA. Ну и wikichip.org в помощь

Но на практике для AVX/AVX2 более интересны не базовые (минимальные) частоты, а как раз максимальные.
K155TM2
Member
88/88 ответов, #152 в рейтинге
4 года на iXBT, с мая 2020
Чаще пишет в "Процессоры" (98%)
Инфо
K
K155TM2 Member
3 года назад / 06 сентября 2021 18:34
bess_temporary

Насколько я понимаю, максимальная латентность получится при перемножении матриц int8 32x32 - 32K операций FMA int8, 32 такта плюс ещё 1-2 такта. Ничего особенного, примерно как деление.
В контексте АМХ 32х32 не может быть, максимально 16х16 элементов f32, которые на сегодня могут быть интерпретируемые как составные элементы u8x4 или f16x2, итого 4К операций над ними (или 16К отдельных для u8, и 8K для f16), с результатом u32x1 или f32x1 соответственно.
bess_temporary
Advanced Member
11094/11211 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 18:45
Я уже понял, что результаты не уместятся. Только почему 16x16 ? 16x32 результатов int16 тоже поместятся (или там int32 накапливается ? забыл)
K155TM2
Member
89/89 ответов, #152 в рейтинге
4 года на iXBT, с мая 2020
Чаще пишет в "Процессоры" (98%)
Инфо
K
K155TM2 Member
3 года назад / 06 сентября 2021 18:56
bess_temporary

Я уже понял, что результаты не уместятся. Только почему 16x16 ? 16x32 результатов int16 тоже поместятся (или там int32 накапливается ? забыл)
Да, int32. Соответствующие 4 субэлементы int8 последовательно умножаются расширяясь до int32, и суммируются вместе, и это будет результат.
matik
Expert
20286/41926 ответов, #7 в рейтинге
23 года на iXBT, с марта 2001
Чаще пишет в "Процессоры" (52%)
Инфо
m
matik Expert
3 года назад / 06 сентября 2021 19:16
bess_temporary
Не, всегда скачивались без NDA. Ну и wikichip.org в помощь
Они не NDA. Но без действующего NDA этот документ разыскать не так-то просто
Либо нужно знать точное имя документа, что тоже с бухты-барахты не угадаешь.
ConstWilD
Member
1135/3806 ответов, #46 в рейтинге
22 года на iXBT, с марта 2002
Чаще пишет в "Политика" (38%)
Украина, Харьков
Инфо
ConstWilD Member
3 года назад / 06 сентября 2021 19:45
bess_temporary
Возможность запустить поток на ядре без вмешательства ОС ?
Возможности запустить новый поток, ИМХО, аппаратный планировщик наверное гарантированно не сможет.
Но вот перенести задачу/тред/поток с Р ядра на Е ядро и обратно, тут я не вижу фундаментальных ограничений.

И на миллионах пользователей сразу всплывут проблемы и артефакты.
Да шо Вы такое на любимку то, клевещете почем зря, Сталина на Вас нет!
Как говорит Обалдевший: ЦП от Интела - ИДЕАЛЬНЫ! А если у ВАС ОШИБКИ - то ВЫ рукожоп.
Raytracer77
Member
23138/47054 ответов, #35 в рейтинге
12 лет на iXBT, с августа 2012
Чаще пишет в "Процессоры" (41%)
Россия, Новороссийск-Москва
Инфо
Raytracer77 Member
3 года назад / 06 сентября 2021 21:41
ConstWilD
скажем так - откровенную кривулину Интел в продакшн не запустит
bess_temporary
Advanced Member
11095/11212 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 21:49
ConstWilD

> Но вот перенести задачу/тред/поток с Р ядра на Е ядро и обратно, тут я не вижу фундаментальных ограничений.

А как вы себе это представляете ? Тем более что всё равно будет прерывание. А любое прерывание - это и есть перенос с ядра на ядро (возможно, на то же самое) (разве что если существуют быстрые прерывания без полного спасения контекста - я в своё время взламывал ядро ОС процессора i860).

> Да шо Вы такое на любимку то, клевещете почем зря, Сталина на Вас нет!

Чью ?

> Как говорит Обалдевший: ЦП от Интела - ИДЕАЛЬНЫ! А если у ВАС ОШИБКИ - то ВЫ рукожоп.

А при чём тут я ?

Добавление от 06.09.2021 21:49:

Raytracer77

> откровенную кривулину Интел в продакшн не запустит

Никакой кривулины в самой гетерогенности нет. Но есть большое разнообразие многопоточных загрузок. И никто пока не знает, как поедет на каждой.

В любом случае, есть 8 хороших ядер, а остальное - довесок (и ещё дополнительные 25% кэша впридачу). Я уже давно это говорил тем, которые непонятно отчего ворчали. Ну а для тех, кто понимает, это не довесок, а хороший бонус
ConstWilD
Member
1137/3808 ответов, #46 в рейтинге
22 года на iXBT, с марта 2002
Чаще пишет в "Политика" (38%)
Украина, Харьков
Инфо
ConstWilD Member
3 года назад / 06 сентября 2021 21:58
Raytracer77
скажем так - откровенную кривулину Интел в продакшн не запустит
Вы так уверены ибо уже забыли про конкретные косяки Интела, с последующим отзывом "кривулин" из продажи.

bess_temporary
А как вы себе это представляете ? Тем более что всё равно будет прерывание.
Вопрос, как ОС узнает на каком именно физическом ядре ЦП исполняется процесс?
По ответу самого ЦП.
Что помешает ЦП, внутреннему шедулеру (микроОС), говорить про одно ядро, а исполнять на другом???
Boris Usievich
Member
19658/47084 ответов, #6 в рейтинге
22 года на iXBT, с октября 2002
Чаще пишет в "Процессоры" (44%)
Инфо
B
Boris Usievich Member
3 года назад / 06 сентября 2021 22:02
ConstWilD
Что помешает ЦП, внутреннему шедулеру (микроОС), говорить про одно ядро, а исполнять на другом???
Здравый смысл
bess_temporary
Advanced Member
11096/11213 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо
b
bess_temporary Advanced Member
3 года назад / 06 сентября 2021 22:07
ConstWilD

> с последующим отзывом "кривулин" из продажи

Каких именно ?

> Вопрос, как ОС узнает на каком именно физическом ядре ЦП исполняется процесс?

Легко. На каком ядре ОС запустила процесс, на то самом она его и найдёт

> Что помешает ЦП, внутреннему шедулеру (микроОС)

Отсутствие этого самого внутреннего {ш,ск}едулера
ConstWilD
Member
1138/3809 ответов, #46 в рейтинге
22 года на iXBT, с марта 2002
Чаще пишет в "Политика" (38%)
Украина, Харьков
Инфо
ConstWilD Member
3 года назад / 06 сентября 2021 22:28
bess_temporary
Каких именно ?
Ошибка Pentium FDIV, была запущена процедура замены
Ошибка в SATA для чипсета Sandy Bridge, была запущена процедура замены.
Вот как раз на "ошибку" с чипсетом попал я лично . А мать не успел поменять по личным обстоятельствам.
С тех пор я на лонче ничего не покупаю, минимум 2-3 месяца после старта продаж.


Отсутствие этого самого внутреннего {ш,ск}едулера
"Ты суслика видишь, а он есть!"(с) почти народное.
Сегодня нет, завтра может быть.
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Страницы:Кликните, чтобы указать произвольную страницуназад1233132333435363738394041172173174далее
Продолжение темы здесь