Главная iXBT.com Конференция Блоги Games Видео Market Prosound ПроБизнес РегистрацияВойти | |
Forzay unregistered |
s0rr0w Member 4535/4802 ответов 20 лет на iXBT, с января 2005 Чаще пишет в "Процессоры" (94%) | Omega слишком часто перекидывать треды по ядрам ещё вредней, чем вообще не перекидывать А кто говорил про "чаще"? Эффективнее не равно чаще. Например, две задачи при слабой нагрузке лучше раскидывать на самые холодные ядра, чтобы буст был как можно лучше. Но если проц нагрет уже и на всех ядрах уже есть нагрузка, то можно догрузить самое горячее ядро, чтобы остальные остыли. Звучит нелогично с первого взгляда, но горячее ядро уже имеет максимальную температуру, поэтому там будет базовая частота или около того. Остальные ядра остынут, что даст возможность ядру, которое все еще загружено, бустить. Задача закончится раньше. На малых ядрах переезд может быть эффективным, если перебрасывать задачу на ядра с одним L2. Эффективность переезда можна улучшить, если заблаговременно начать миграцию кэша в соседний L3 больших ядер из L2 малых, а уже потом говорить OS, перекинь тред с такого-то ядра на такое, все готово уже. Короче, вангую более сложные механизмы управления тредами, чем это есть сейчас. |
bess_temporary Advanced Member 11074/11191 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. |
Boris Usievich Member |
Raytracer77 Member 23137/47051 ответов, #35 в рейтинге 12 лет на iXBT, с августа 2012 Чаще пишет в "Процессоры" (41%) Россия, Новороссийск-Москва |
bess_temporary Advanced Member 11075/11192 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | В "Зене-2" оно вовсе не общий. Как, естественно, и между кристаллами "Зена-3". |
Boris Usievich Member | Raytracer77 Мы вроде в ветке про alder lake, причем тут вообще zen? |
Omega Member | Forzay >Не так. В поговорке о равенстве двух переездов и одного пожара. ходят оба варианта, это просто разная степень преувеличения последствий переезда. 1=1/2 пожара, скорее про материальные потери(разбитая посуда, поврежденная мебель), а 1=2 пожара скорее про моральные\социальные потери от переезда, от смены привычного окружения. s0rr0w Но если проц нагрет уже и на всех ядрах уже есть нагрузка, то можно догрузить самое горячее ядро, чтобы остальные остыли. Звучит нелогично с первого взгляда, но горячее ядро уже имеет максимальную температуру, поэтому там будет базовая частота или около того. по сути вы описываете грубый вариант троттлига\скейлинга на уровне ядер с сильно заметными колебаниями производительности, что во первых не понравятся приложениям, которые чувствительны к задержкам. Снизим общую производительность в надежде, что потом в сумме догоним кол-во инструкций, за счет большего буста у "остывших" ядер. А если ваша задача закончится в момент, когда вы будете тротлить\остывать, скинув несколько тредов на одно ядро? Основная же идея буста как раз обратная, давайте попробуем как можно быстрее завершить задачу, за счет максимальной частоты\вольтажа, а если не получилось завершить за краткое, но ещё безопасное время, то так и быть, уменьшим частоту/вольтаж до безопасной температуры\мощности за длительный период. |
bess_temporary Advanced Member 11082/11199 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | Надо иметь в виду, что все эти алгоритмы нужны только тогда, когда число активных потоков заметно меньше числа (виртуальных) ядер. И иногда, когда их заметно больше (впрочем, не уверен). Если же число потоков равно числу ядер (или несколько меньше), то всё будет работать либо само собой, либо в соответствии с привязкой потоков к ядрам и с алгоритмом параллельной программы (набора программ). Поэтому в моём плане тестирования нет вопросов к этому директору. Хотя его тоже можно было бы потестировать |
Omega Member | >базовая частота это вообще уже маркетинговый термин. Процы живут в бусте от мин до макс. буста. Снижение базовой частоты может быть и положительным признаком, просто означать, что проц на этой частоте имеет достаточно производительности для поддержки интерактивной среды. |
s0rr0w Member 4536/4803 ответов 20 лет на iXBT, с января 2005 Чаще пишет в "Процессоры" (94%) | Ага, на схеме вижу, что у кластера слабых ядер таки на схеме есть L3. Ошибочка вышла, я думал, что у них только L2. Добавление от 06.09.2021 14:42: |
SlaveN_VM Member 1872/3344 ответов 17 лет на iXBT, с января 2008 Чаще пишет в "Процессоры" (52%) Россия, Москва Web-страница | Omega означать, проц на этой частоте имеет достаточно производительности для поддержки интерактивной среды Не означает. Процессоры Интел (и АМД) умеют снижать частоту сильно ниже базовой, "для интерактивной среды" может быть и 800 МГц, и ниже. Насколько я понимаю, базовая тактовая частота - это то, что производитель гарантирует в заданном ТДП при любых (паспортных) условиях эксплуатации. То есть написано "TDP 125 Вт, температура окружающей среды до 40 градусов" - значит, при полной нагрузке на AVX, при любом кулере под этот ТДП и при указанной температуре в помещении проц должен держать базовую ТЧ, не скатываясь в троттлинг. Исправлено: SlaveN_VM, 06.09.2021 14:50 |
s0rr0w Member 4537/4804 ответов 20 лет на iXBT, с января 2005 Чаще пишет в "Процессоры" (94%) | Omega давайте попробуем как можно быстрее завершить задачу В подходе big.LITTLE это может не работать как хочется. Буст энергоэффективных ядер меньше, чем производительных. Для идеального ускорения придется сначала перемещать процессы. Но снова же, не факт что буст и возможен при постоянно высокой нагрузке. |
Boris Usievich Member |
bess_temporary Advanced Member 11086/11203 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | s0rr0w > Ага, на схеме вижу, что у кластера слабых ядер таки на схеме есть L3 Не совсем так. У них нет своего L3. У них, как и у больших ядер, на узле кольцевой шины есть такой же сегмент L3-кэша. И все эти сегменты равномерно делятся по адресам, образуя общий однородный L3-кэш. Подозреваю, что размер кластера малых ядер всё-таки больше, чем размер большого ядра. Что же касается 1/4 потребления для 1/2 производительности (от большого ядра), этого, кажется, достигнуть нетрудно. Достаточно просто подсчитывается. |
Omega Member | SlaveN_VM потому базовую частоту назначает "технический маркетинг", проводя опросы на какой частоте у конкретного проца пользователи оболочки современных ОС, и набора популярного ПО, чаще начинают жаловаться на тормоза.... при полной нагрузке на AVX, при любом кулере под этот ТДП и при указанной температуре в помещении проц должен держать базовую ТЧ, не скатываясь в троттлинг. The processor base frequency is the operating point where TDP is definedдалее смотрим как назначается TDP.... Thermal Design Power (TDP) represents the average power, in watts, the processor dissipates when operating at Base Frequency with all cores active under an Intel-defined, high-complexity workload. далее смотрим, что такое Intel-defined, high-complexity workload... However, during turbo or certain workload types such as Intel® Advanced Vector Extensions (Intel® AVX) it can exceed the maximum TDP but only for a limited time , or Until the processor hits a thermal throttle temperature, or Until the processor hits a power delivery limit. и оказывается, что код с AVX может превышать TDP, значит такой нагрузкой не является. Исправлено: Omega, 06.09.2021 15:54 |
bess_temporary Advanced Member 11088/11205 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | Код может превышать TDP, если система охлаждения позволяет отводить тепло. Таким образом, экстремальное тепловыделение есть свойство среды, окружающей процессор. Ну и свойство выносливости процессора, конечно Ну и напомню, что для AVX/AVX2 приводятся другие базовые частоты. |
Omega Member | >Ну и напомню, что для AVX/AVX2 приводятся другие базовые частоты. которых никто в маркетинговых материалах на коробках не пишет. |
bess_temporary Advanced Member 11089/11206 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | Тот, кто читает маркетинговые материалы на коробках, не использует AVX |
matik Expert |
bess_temporary Advanced Member 11092/11209 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | matik Не, всегда скачивались без NDA. Ну и wikichip.org в помощь Но на практике для AVX/AVX2 более интересны не базовые (минимальные) частоты, а как раз максимальные. |
K155TM2 Member | В контексте АМХ 32х32 не может быть, максимально 16х16 элементов f32, которые на сегодня могут быть интерпретируемые как составные элементы u8x4 или f16x2, итого 4К операций над ними (или 16К отдельных для u8, и 8K для f16), с результатом u32x1 или f32x1 соответственно. |
bess_temporary Advanced Member 11094/11211 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | Я уже понял, что результаты не уместятся. Только почему 16x16 ? 16x32 результатов int16 тоже поместятся (или там int32 накапливается ? забыл) |
K155TM2 Member |
matik Expert |
ConstWilD Member 1135/3806 ответов, #46 в рейтинге 22 года на iXBT, с марта 2002 Чаще пишет в "Политика" (38%) Украина, Харьков | bess_temporary Возможность запустить поток на ядре без вмешательства ОС ? Возможности запустить новый поток, ИМХО, аппаратный планировщик Но вот перенести задачу/тред/поток с Р ядра на Е ядро и обратно, тут я не вижу фундаментальных ограничений. И на миллионах пользователей сразу всплывут проблемы и артефакты. Да шо Вы такое на любимку то, клевещете почем зря, Сталина на Вас нет! Как говорит Обалдевший: ЦП от Интела - ИДЕАЛЬНЫ! А если у ВАС ОШИБКИ - то ВЫ рукожоп. |
Raytracer77 Member 23138/47054 ответов, #35 в рейтинге 12 лет на iXBT, с августа 2012 Чаще пишет в "Процессоры" (41%) Россия, Новороссийск-Москва | ConstWilD скажем так - откровенную кривулину Интел в продакшн не запустит |
bess_temporary Advanced Member 11095/11212 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | ConstWilD > Но вот перенести задачу/тред/поток с Р ядра на Е ядро и обратно, тут я не вижу фундаментальных ограничений. А как вы себе это представляете ? Тем более что всё равно будет прерывание. А любое прерывание - это и есть перенос с ядра на ядро (возможно, на то же самое) (разве что если существуют быстрые прерывания без полного спасения контекста - я в своё время взламывал ядро ОС процессора i860). > Да шо Вы такое на любимку то, клевещете почем зря, Сталина на Вас нет! Чью ? > Как говорит Обалдевший: ЦП от Интела - ИДЕАЛЬНЫ! А если у ВАС ОШИБКИ - то ВЫ рукожоп. А при чём тут я ? Добавление от 06.09.2021 21:49: Raytracer77> откровенную кривулину Интел в продакшн не запустит Никакой кривулины в самой гетерогенности нет. Но есть большое разнообразие многопоточных загрузок. И никто пока не знает, как поедет на каждой. В любом случае, есть 8 хороших ядер, а остальное - довесок (и ещё дополнительные 25% кэша впридачу). Я уже давно это говорил тем, которые непонятно отчего ворчали. Ну а для тех, кто понимает, это не довесок, а хороший бонус |
ConstWilD Member 1137/3808 ответов, #46 в рейтинге 22 года на iXBT, с марта 2002 Чаще пишет в "Политика" (38%) Украина, Харьков | Raytracer77 скажем так - откровенную кривулину Интел в продакшн не запустит Вы так уверены ибо уже забыли про конкретные косяки Интела, с последующим отзывом "кривулин" из продажи. bess_temporary А как вы себе это представляете ? Тем более что всё равно будет прерывание. Вопрос, как ОС узнает на каком именно физическом ядре ЦП исполняется процесс? По ответу самого ЦП. Что помешает ЦП, внутреннему шедулеру (микроОС), говорить про одно ядро, а исполнять на другом??? |
Boris Usievich Member |
bess_temporary Advanced Member 11096/11213 ответов, #1 в рейтинге 7 лет на iXBT, с января 2018 1 фото на iXBT.photo Чаще пишет в "Процессоры" (98%) Россия, iXBT.com c 1997 г. | ConstWilD > с последующим отзывом "кривулин" из продажи Каких именно ? > Вопрос, как ОС узнает на каком именно физическом ядре ЦП исполняется процесс? Легко. На каком ядре ОС запустила процесс, на то самом она его и найдёт > Что помешает ЦП, внутреннему шедулеру (микроОС) Отсутствие этого самого внутреннего {ш,ск}едулера |
ConstWilD Member 1138/3809 ответов, #46 в рейтинге 22 года на iXBT, с марта 2002 Чаще пишет в "Политика" (38%) Украина, Харьков | bess_temporary Каких именно ? Ошибка Pentium FDIV, была запущена процедура замены Ошибка в SATA для чипсета Sandy Bridge, была запущена процедура замены. Вот как раз на "ошибку" с чипсетом попал я лично С тех пор я на лонче ничего не покупаю, минимум 2-3 месяца после старта продаж. Отсутствие этого самого внутреннего {ш,ск}едулера "Ты суслика видишь, а он есть!"(с) почти народное. Сегодня нет, завтра может быть. |