Последние темы Поиск
Общие форумы
Специализированные форумы
ПроцессорыРазгон и охлаждениеСистемные платыМодули памятиВидеосистемаTV- и FM-тюнеры, видеовход, видеовыходЦифровое видео: захват, монтаж, обработкаМониторы и другие устройства отображенияЦифровое фотоБеспилотные летательные аппаратыЦифровой звукProAudio: Профессиональное звуковое оборудованиеСтереосистемыДомашний кинотеатр: проигрыватели и источники сигналаДомашний кинотеатр: аудиосистемаДомашний кинотеатр: ТV и проекторыМагнитные и SSD накопителиОптические носители информацииСетевые носители информацииПериферияКорпуса, блоки питания, UPSСети, сетевые технологии, подключение к интернетуСистемное администрирование, безопасностьСерверыНоутбуки, нетбуки и ультрабукиПланшеты и электронные книгиМобильные телефоны, смартфоны, кпк, коммуникаторыМобильные гаджетыОператоры и технологии мобильной связиТелефония, телекоммуникации, офисные АТСБытовая техника
Программы
Игры
Авторские форумы
Прочие форумы
Форумы поддержки портала iXBT.com
Архивы конференции
Архив "О Конференции"Архив "Процессоры"Архив "Разгон и охлаждение"Архив "Системные платы"Архив "Модули памяти"Архив "Видеосистема"Архив "Видеозахват"Архив "Мониторы и другие устройства отображения"Архив "Цифровое изображение"Архив "Цифровой звук"Архив "Периферия"Архив "Корпуса, блоки питания, UPS"Архив "Коммуникации: сети и сетевые технологии"Домашний интернет, модемы (архив)Архив "Системное администрирование, безопасность"Архив "Мобильная связь"Программы Microsoft: Windows, Office, Server, Windows LiveАрхив "OС и системное ПО"Архив "Программы: Интернет"Архив "Программирование"Форум прикладных программистовАрхив "Электронные устройства и компоненты"Архив "Околокомпьютерный Флейм & Общий"Архив "Полемика (Злобный Флейм)"Околоавтомобильный ФлеймФорум ремонтниковВопросы компании IntelФотокамеры SamsungФорум о магазине приложений RuStoreФорум по продукции компании Huawei
Справка и сервисы
Другие проекты iXBT.com
Страницы:Кликните, чтобы указать произвольную страницуназад123789101112
SVG4K: Intel представила APX - расширение архитектуры x86-64
mrzet
Member
4334/7391 ответов, #21 в рейтинге
7 лет на iXBT, с февраля 2018
Чаще пишет в "Процессоры" (60%)
Инфо Ответить
mrzet Member
2 месяца назад / 16 января 2025 09:21
Поскольку при отсутствии кеша uop'ов декодеры вынуждены работать на весь цикл то исходная проблема кроется в предвыборке из L1I - длинные команды идущие большой группой не укладываются в темп загрузки в оные. Потому то потребно сокращение длины команд. Проблема только на Gracemont, Crestmont, в Skymont ее уже не будет (как впрочем и любых P-ядрах или на Zen'ах). Однако поскольку разрабатывается универсальная техника кодирования под эту оптимизацию - приходится использовать наихудшие возможности из всего спектра имеющихся.
В принципе этого достаточно, так как предмет не столь интересен, чтобы углубляться.
Он чертовски интересен ( для заинтересованных ).Тема: расширение APX. Самая интересная часть APX - расширение архитектурных РОН до 31(32) штуки.
Техника которую мы обсуждаем - способна уже сейчас дать нам аналог этих РОН, и не надо ждать пока APX воплотится в железе. И мало того что это не завтра произойдет,а в массы новое железо пойдет когда цена на него станет приемлимой. То есть через 2-4 года. И надо еще учитывать что должно произойти насыщение данным железом ( не для единичных же экземпляров кодить!) что откладывает срок еще на 2-4 года. А то о чем я пишу - это сейчас и здесь. Почувствуйте разницу.

Исправлено: mrzet, 16.01.2025 11:25

SVG4K
Member
Автор темы
232/2532 ответов, #72 в рейтинге
7 лет на iXBT, с января 2018
Чаще пишет в "Накопители" (14%)
Россия, Хабаровск
Инфо Ответить
SVG4K Member Автор темы
2 месяца назад / 16 января 2025 15:30
bess_temporary Неужели вы всерьёз думаете, что кто-то пытается расшифровать ваш птичий язык?

Я в этой теме спецом читаю посты mrzet , патамучта остальное вода водяная. Все слова понятны, у вас выгорание видимо, плесните кофе

Добавление от 16.01.2025 15:30:

mrzet и не надо ждать пока APX воплотится в железе

(с) святая бюрократия от Интел. Еще при рывке в х64 не было ни копеечной проблемы ортогонально добавить РОН. Бюджетов хватало. Теперь у них назрел огромный косяк с раздутым кодированием кода. Детская болезнь повзрослела и потеряла берега.
bess_temporary
Advanced Member
20732/20969 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо Ответить
b
bess_temporary Advanced Member
2 месяца назад / 16 января 2025 16:36
SVG4K

Вам просто не приходилось читать написанное нормальными словами

Ну и если вы так цените упомянутого товарища, то почему не подсказали ему, как устроен L3-кэш?
SVG4K
Member
Автор темы
233/2533 ответов, #72 в рейтинге
7 лет на iXBT, с января 2018
Чаще пишет в "Накопители" (14%)
Россия, Хабаровск
Инфо Ответить
SVG4K Member Автор темы
2 месяца назад / 16 января 2025 16:50
bess_temporary то почему не подсказали ему, как устроен L3-кэш?

L3 далеко и латентно, он в этой оптимизации не при делах. Зачем рассказывать, я же не профи. Знаю что самый бодрый L3 сейчас у Хуанга, все Х86 хуже , где это в этих статьях :
https://chipsandcheese.com/archive
https://semianalysis.com/archives/
matik
Expert
23868/45670 ответов, #7 в рейтинге
24 года на iXBT, с марта 2001
Чаще пишет в "Процессоры" (52%)
Инфо Ответить
m
matik Expert
2 месяца назад / 16 января 2025 16:53
SVG4K
Знаю что самый бодрый L3 сейчас у Хуанга, все Х86 хуж
С чего бы это?
Сомнительно дюже.
Потом почитаю, но предварительно сомневаюсь. Не те частоты работы, у х86 заметно повыше.
bess_temporary
Advanced Member
20733/20970 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо Ответить
b
bess_temporary Advanced Member
2 месяца назад / 16 января 2025 16:55
SVG4K

Хуанг - это не процессор и не кэш, а какой-то нерусский человек
VLev
Expert
18279/28347 ответов, #2 в рейтинге
23 года на iXBT, с января 2002
6 фото на iXBT.photo
Чаще пишет в "Процессоры" (64%)
Россия, Moscow
Инфо Ответить
V
VLev Expert
2 месяца назад / 16 января 2025 17:16
matik
Сомнительно дюже.
Пол-года назад начинал разбираться вот тут: Архитектура кеша *) L3: кольцо vs решётка vs локальный для CCX vs Что лучше для многоядерных процессоров?, #369
matik
Expert
23869/45671 ответов, #7 в рейтинге
24 года на iXBT, с марта 2001
Чаще пишет в "Процессоры" (52%)
Инфо Ответить
m
matik Expert
2 месяца назад / 16 января 2025 17:22
VLev
Пол-года назад начинал разбираться вот тут
38нс - это намного хуже того, что в х86 процессорах. Так что предварительно правильно не верил
SVG4K
Member
Автор темы
234/2534 ответов, #72 в рейтинге
7 лет на iXBT, с января 2018
Чаще пишет в "Накопители" (14%)
Россия, Хабаровск
Инфо Ответить
SVG4K Member Автор темы
2 месяца назад / 17 января 2025 04:57
matik Так что предварительно правильно не верил

Все верно, Х86 лучше. В статье автор нахваливал какой быстрый L3 в районе 30нс, мол лучше всех. Ну оказывается, надо было всего то AIDA64 глянуть и увидеть 12нс в процессоре своего компа. Косяк-с.
Andnet2
Member
388/707 ответов
3 года на iXBT, с апреля 2021
Чаще пишет в "Процессоры" (54%)
Инфо Ответить
A
Andnet2 Member
30 дней назад / 26 февраля 2025 14:02
В этих слухах написано, что у Intel NovaLake будет AVX 10.2 и APX.
07.02.25 New Leaks Point Towards Intel Arrow Lake Refresh, Nova Lake Desktop CPUs With Up To 52 Cores, Panther Lake With Up To 180 TOPs
https://wccftech.com/new-leaks-intel-arrow-lake-refr…e-up-to-180-tops/
Omega
Expert
11258/13326 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо Ответить
O
Omega Expert
8 дней назад / 20 марта 2025 02:31
Наконец цветок разума пробился через бетон маркетинга. Все ядра с AVX10.2 будут поддерживать 512bit инструкции, вкл. Е-cores у новых процов.
AVX10 hardware will all have 512-bit vector width support

https://www.phoronix.com/news/Intel-AVX10-Drops-256-Bit
In this new whitepaper, all the platforms will support 512 bit vector width (previously, E-core is up to 256 bit, leading to hybrid clients and Atom Server 256 bit only). Also, 256 bit rounding is not that useful because we currently have rounding feature directly on E-core now and no need to use 256-bit rounding as somehow a workaround. HW will remove that support.
The Converged Vector ISA: Intel® Advanced Vector Extensions 10
Technical Paper March 2025 Revision 3.0
https://cdrdv2.intel.com/v1/dl/getContent/784343
bess_temporary
Advanced Member
21411/21648 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо Ответить
b
bess_temporary Advanced Member
8 дней назад / 20 марта 2025 06:37
Omega

Спасибо за красиво изложенную новость
matik
Expert
24192/46006 ответов, #7 в рейтинге
24 года на iXBT, с марта 2001
Чаще пишет в "Процессоры" (52%)
Инфо Ответить
m
matik Expert
8 дней назад / 20 марта 2025 11:48
Omega
Наконец цветок разума пробился через бетон маркетинга. Все ядра с AVX10.2 будут поддерживать 512bit инструкции, вкл. Е-cores у новых процов.
Boris Usievich
Member
24408/54534 ответов, #6 в рейтинге
22 года на iXBT, с октября 2002
Чаще пишет в "Процессоры" (44%)
Инфо Ответить
B
Boris Usievich Member
8 дней назад / 20 марта 2025 12:00
Omega
Маркетинг тут не причем, конечно. Просто кто серьезно облажался, когда планировал гетерогенные процессоры. В итоге пришлось отключать на Alder lake etc работающие AVX-512

А что такое "256 bit rounding" и зачем оно специально упоминается?
Omega
Expert
11260/13331 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо Ответить
O
Omega Expert
8 дней назад / 20 марта 2025 16:30
у AVX512 в префиксе пересекались биты указания размера регистра(256) и embedded rounding mode(фича AVX512 позволяющая указывать правила округления для отдельной инструкции, а не переключать default для всего потока в контрольном регистре
To nearest rounding mode, Toward negative infinity rounding mode, Toward positive infinity rounding mode, Toward zero rounding mode )
поэтому для 256bit это надо было обходить в компиляторе или менять формат префикса для таких инструкций в новом AVX10.2\256.
Скрытый текст

>Просто кто серьезно облажался

дык, это старая тема, предлагалось несколько вариантов как совместить с AVX512, самый очевидный quad pumping на E-cores на имеющихся EXE-модулях. Маркетологи выбрали самый простой\дешевый - отключить на P, который не надо отлаживать\сертифицировать новый микрокод для E\P.

Исправлено: Omega, 20.03.2025 16:40

bess_temporary
Advanced Member
21413/21650 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо Ответить
b
bess_temporary Advanced Member
8 дней назад / 20 марта 2025 16:36
Omega

Как это могли пересекаться и что такое обходить в компиляторе? Нет ли ссылки на первоисточник информации?
Omega
Expert
11261/13332 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо Ответить
O
Omega Expert
8 дней назад / 20 марта 2025 17:01
bess_temporary

это гуглится...

https://en.wikipedia.org/wiki/EVEX_prefix

Bit L’ for specifying 512-bit vector length, or rounding control mode when combined with L

... reuse of bits in the EVEX prefix to encode both rounding mode and register size makes it impossible to have rounding control on AVX instructions that operate on 256-bit registers.

... the different fields are EVEX.b and EVEX.L'L. According to the docs, if b is not set, then L'L is the SIMD length, so 0 = xmm and 2 = zmm. If b is set, the L'L is reinterpreted as the static rounding mode and the length is assumed to be zmm (512 bits).

>обходить в компиляторе

ранее не использовать старые инструкции с округлением с 256bit типами, а потом начать использовать новые AVX10\256 c новым префиксом? Теперь снова вернуться к "неиспользованию". Они явно считают, что это не было популярным, выбор rounding на уровне инструкций, теперь будет или через контрольный регистр, или как по-умолчанию указано для этой инструкции в микрокоде, что уже не проблема компилятора.

Исправлено: Omega, 20.03.2025 17:18

bess_temporary
Advanced Member
21414/21651 ответов, #1 в рейтинге
7 лет на iXBT, с января 2018
1 фото на iXBT.photo
Чаще пишет в "Процессоры" (98%)
Россия, iXBT.com c 1997 г.
Инфо Ответить
b
bess_temporary Advanced Member
7 дней назад / 20 марта 2025 20:31
Omega

Я сейчас на смартфоне

Добавление от 20.03.2025 17:07:

Всё равно странно. Потом покопаюсь.

Добавление от 20.03.2025 20:31:

> ранее не использовать старые инструкции с округлением с 256bit типами, а потом начать использовать новые AVX10\256 c новым префиксом? Теперь снова вернуться к "неиспользованию"

Да, порнография
Omega
Expert
11287/13360 ответов, #4 в рейтинге
12 лет на iXBT, с мая 2012
Чаще пишет в "Процессоры" (84%)
Инфо Ответить
O
Omega Expert
вчера / 26 марта 2025 23:21
предлагают дополнить\заменить AVX10.2 takum-форматами для операций с матрицами.

arXiv:2503.14067v1 [cs.AR] 18 Mar 2025
Streamlining SIMD ISA Extensions with Takum
Arithmetic: A Case Study on Intel AVX10.2
https://arxiv.org/pdf/2503.14067

Beating Posits at Their Own Game: Takum Arithmetic
https://arxiv.org/pdf/2404.18603

Evaluation of Bfloat16, Posit, and Takum Arithmetics in Sparse Linear Solvers
https://arxiv.org/pdf/2412.20268

Основные характеристики Takum

Логарифмическая tapered-precision: Takum использует уникальную схему кодирования экспоненты, что позволяет более эффективно представлять числа и улучшает динамический диапазон по сравнению с Posit.
Сравнение с Posit: Исследования показывают, что Takum может превосходить Posit в некоторых аспектах, таких как стабильность и точность, особенно в задачах, связанных с разреженными линейными решателями.
Упрощение кодирования и декодирования: В отличие от Posit, длина битовой строки в Takum минимально влияет на сложность процессов кодирования и декодирования, что делает его более эффективным для аппаратной реализации.

Исправлено: Omega, 27.03.2025 02:36

Boris Usievich
Member
24422/54564 ответов, #6 в рейтинге
22 года на iXBT, с октября 2002
Чаще пишет в "Процессоры" (44%)
Инфо Ответить
B
Boris Usievich Member
вчера / 27 марта 2025 00:03
Omega
Боюсь никто из производителей железа не пошевелится, пока на альтернативу IEEE-754 не будет стандарта.
Ваш ответ:

Нет значка Нет значка Вот тут! Лампочка Восклицание Вопрос Класс! Улыбка Злость Огорчение Поговорим? Краснею Подмигивание Ругаю ОдобряюBIUdelSxsupxsuboffsp spoilerqurlimgvideo• list1. list1 codeprecenter-hr-rusQWE→ЙЦУ
файлыочистить
Ваше имя: Авторизуйтесь Предпросмотр В полную форму
вставить выделенную цитату в окно ответа
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Страницы:Кликните, чтобы указать произвольную страницуназад123789101112