Saturn
Дык, эта...
unakafow Member 957/7932 ответов, #70 в рейтинге 18 лет на iXBT, с февраля 2007 330 фото на iXBT.photo Чаще пишет в "Эл. устройства" (30%) | Saturn Дык, эта... |
Saturn Member 5265/79553 ответов 22 года на iXBT, с ноября 2002 6 фото на iXBT.photo Чаще пишет в "Фото" (32%) США, California | unakafow Нет конечно, это кнопочка шумоподавления у радиоприемника, шипение в котором конечно несло важную информацию о состоянии ионосферы, но было ненужно. |
Григорий-Г Member 12006/42875 ответов, #3 в рейтинге 23 года на iXBT, с ноября 2001 1 фото на iXBT.photo Чаще пишет в "Видеозахват" (26%) Россия, Россия Web-страница | z2003 на http://cyberkeeper.ru/ru/repair/videomontaj2017.html там RAM - 16 GB Это премьер супер жруч. Я купил сначала 16 (два по 8), но тредриперу строго нужно 4 канала, пришлось тут же докупить еще два по 8 Результат - в самых тяжелых многокамерных 4к дорожках повердиректор лопает не больше 14 гб, остальное спит. Так что - смотря какой редактор. ЗЫ а если подключить видеокарту к обработке - самые тяжелые 4 дорожки 4к видео с кучей эффектов - занимают 8 гб. Сделал своп на всякий случай на SSD... но мониторинг показывает, что он пуст - 32 гб явный перебор, часть памяти никогда не задействуется, вообще. |
DTL Member | ну вообщем тово - зион голд 6134 на 6 каналов мемори смог опередить в 16 потоках и5-11600 примерно в 2 раза на тесте шумодава. но оно и по цене в разы отлично. и на зионе переход от 8 на 16 потоков таки ощутим (на ок 40 процентов прироста). а на и5-11600 с двумя односторонними планками - разницы между 8 и 16 гипертрединговыми потоками нет вааще. |
Filin74 Member 1605/9771 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | DTL и програмы над точить под линейный доступ до строк рамы. Программы нужно точить под мультипоточность и опциональное использование GPU для ускорения где позволяет алгоритм. Так, уже и ресайзинг на GPU делают. Т.е. такая операция как перекодирование из одного кодека в другой с ресайзингом вообще не требует нагрузки на CPU. По поводу AVX. Большинство программ пишутся на языках высокого уровня. И низкоуровневая оптимизация под современные инструкции отдается на усмотрение компилятора. Программисты такой хренью просто не заморачиваются. Да и мало кто способен низкоуровневые ассемблерные вставки делать. Я, например, никогда не использовал. У них задача хотя бы распараллелить максимально. Вы попробуйте вот что. Есть такой кодировщик в новейший кодек Intel SVT-AV1 https://www.ixbt.com/news/2019/02/04/intel-publikuet…go-veshanija.html https://habr.com/ru/company/intel/blog/439948/ Его разработал Интел. Вот сравните для интереса его скорости на интелах с avx512 и райзенах. Уж интел то должна по уму свой кодировщик с оптимизацией под свои процы сделать. Есть и другие кодировщики от других разработчиков. Там тоже можно скорости сравнить. |
DTL Member | Filin74 Программы нужно точить под мультипоточность да безтолку. ависинф типа идеально многопоточен разнокадрово но при плохом доступе потоков к адресам мемори - скорости пичалька. У них задача хотя бы распараллелить максимально. при видимо из многокадров можно просто сунуть групы кадров в отдельны треды. выходит ощутимо бодрее попыток многотредности внутри кадра и похоже потерь времени на синхро потоков по концу кадра. и райзенах такое вхозяйстве отсутствует. кодировщик в новейший кодек Intel SVT-AV1 мало понятно куда оно такое нужно вхозяйстве. ни на торенты покласть ни на показывалке посмотреть. безтолку тратить ресурсы на кодирование вникчемное типа. Добавление от 11.12.2021 08:29: щас вот реально друга тема пошла - мелкософт вроде уболтал хардваределов застандартить апи на мошн естимейшн из кусков реальных хардварно ускореных енкодеров мпега - https://docs.microsoft.com/en-us/windows/win32/medfo…motion-estimationто значит мож выйдет прикрутить это ускорение к усреднялке кадриков и уменьшать количество помех. а при малых помехах у наманых обычных хозбыт мпегов типа 264 лучшее и меньшее результат выходной. Добавление от 11.12.2021 08:36: Filin74https://habr.com/ru/company/intel/blog/439948/ "Кодировщик AV1 предназначен для высоконагруженных стриминговых сервисов и отличается большими возможностями масштабирования — максимально до 112 логических процессоров." прямо таки вкаждом чайнике каждой домохозяйке мастхев. "С вычислительной точки зрения он сильно оптимизирован под современные процессоры Intel Xeon Scalable и Xeon D, хотя в принципе возможен его запуск на любом процессоре Intel Core, начиная с пятого поколения (в переводе на поколения Intel Xeon — E5-v4 или новее). Для оптимизации кодирования кроме параллелизации активно используются векторные инструкции вплоть до AVX2. " прямо таки байтораздирающе люта пичаль. в 2021 вхозбыт начал заходить уже авх512 и взионах взрослых дядей оно уже с половину от десятки века+. а тута героически смогли устроить заточку под авх2 времен начала 201х. наверн стриминговым датацентрам малоимущих куда цпу с авх2 будут собирать по помойкам вокруг городов. Добавление от 11.12.2021 08:45: Filin74Его разработал Интел. исходя из текста статьи на хабре - его разработал какой-то умственно особенный организм которому интел долго и усердно подсказывал как делать программы под устарелы на две пятилетки цпу. ну для многих вырожденцев и это огромный успех. |
Filin74 Member 1606/9773 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | DTL мало понятно куда оно такое нужно вхозяйстве. ни на торенты покласть ни на показывалке посмотреть. безтолку тратить ресурсы на кодирование вникчемное типа. Вы сетовали, что программы не используют AVX512. Вот возьмите современную высокотехнологичную программу разработки интел. И сравните, что там дает это самое AVX512. Я вам не кодировать в AV1 предлагаю, А СРАВНИТЬ! СРАВНИТЬ скорость работы с AVX512 и без. На примере "современной высокотехнологичной программы разработки интел". Мне лень искать. |
DTL Member |
Filin74 Member 1607/9774 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | DTL исходя из текста статьи на хабре - его разработал какой-то умственно особенный организм которому интел долго и усердно подсказывал как делать программы под устарелы на две пятилетки цпу. ну для многих вырожденцев и это огромный успех. Понятно. Т.е. даже сам интел не может писать правильные программы под свои процы. Все кретины кругом. Проц хороший, но людей еще нет, чтобы программы правильные под них писать. |
DTL Member | Filin74 программы не используют AVX512. Вот возьмите современную высокотехнологичную программу разработки интел. И сравните, что там дает это самое AVX512. агде там авх512 то. в перевирании хо6отом - там может быть авх512. https://www.ixbt.com/news/2019/02/04/intel-publikuet…go-veshanija.html вероятно, использует набор инструкций AVX-512. в признании а....ра поделки на хабре - https://habr.com/ru/company/intel/blog/439948/ активно используются векторные инструкции вплоть до AVX2. эта хрень устарела уже позавчера. |
Filin74 Member 1608/9775 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | DTL роботами она примерно равна нулю. Это не роботы. Это тоже программы, написанные людьми. Но если с AVX512 это невозможно, то создатель Линукс был прав. Линус Торвальдс призвал Intel похоронить набор команд AVX-512 и заняться делом 13.07.2020 [11:45], Алексей Разин Перешедший недавно на использование AMD Ryzen Threadripper создатель Linux Линус Торвальдс (Linus Torvalds) не постеснялся в выражениях, выступив с критикой политики Intel, которая подразумевает поддержку расширений AVX-512 в большинстве новых поколений процессоров марки. Данный набор команд, по словам Торвальдса, несёт только вред и востребован только в отвлечённых бенчмарках. Добавление от 11.12.2021 09:19: Поводом для подобной эмоциональной реакции создателя Linux стало упоминание об отсутствии поддержки расширений AVX-512 со стороны будущих клиентских процессоров Alder Lake-S. «Я верю, что AVX-512 умрут в муках, а Intel начнёт устранять реальные проблемы вместо попыток создания волшебных инструкций, которые потом позволят их процессорам выгодно выступать в специально созданных тестах», — заявил Линус Торвальдс. Специалистам Intel, по его мнению, надлежит сосредоточиться на совершенствовании обработки кода общего назначения, а не всяческих специализированных и экзотических инструкций. Исторически, по словам Торвальдса, процессоры Intel не очень хорошо выступали в операциях с плавающей запятой, и эту проблему давно следовало бы решить. Потраченный на поддержку AVX-512 «транзисторный бюджет» лучше было бы направить на увеличение количества ядер или повышение их производительности. Использование расширений AVX-512 увеличивает энергопотребление процессоров, из-за чего процессоры достигают более низких частот под нагрузкой, чем без AVX-512. Резюмирует свою «исповедь» Торвальдс заявлением о том, что в большинстве случаев расширений AVX2 более чем достаточно. |
DTL Member | Filin74 Но если с AVX512 это невозможно это и с более старыми симд сопроцессорами мало успешно вроботизироаном варианте - уже бы авх 256бит и ссе 128бит героически рулили примерно везде. но практически симд рулит заметно ток в особенно составленых програмах спониманием. вместо героических включений оптимизирований вкомпиляторах на векторный сопроцессор с опред номером поколений. Добавление от 11.12.2021 09:32: Filin74Это не роботы. Это тоже программы, написанные людьми. *можн спать спокойно - скайнет нас никогда не победит бо то просто программа Добавление от 11.12.2021 09:35: Filin74но людей еще нет, чтобы программы правильные под них писать. физически унылее - уже нет. Добавление от 11.12.2021 09:42: Filin74Данный набор команд, по словам Торвальдса, несёт только вред и востребован только в отвлечённых бенчмарках. практически скорее способности авх512 сильно превысили возможности безконечно отсталой говносдрамы и потому основно время авх512 сопроцессор стоит и скучает и ждет раму. а под возможности двухканалов скорбной наличной сдрамы хватает и авх2. Добавление от 11.12.2021 09:46: Filin74Intel начнёт устранять реальные проблемы то над *вконсерватории* править капитально. а устарела начетверть века х86 раздута до х64 костылями уже плохо могет. Добавление от 11.12.2021 09:51: Filin74процессоры Intel не очень хорошо выступали в операциях с плавающей запятой, и эту проблему давно следовало бы решить. Потраченный на поддержку AVX-512 «транзисторный бюджет» лучше было бы направить на увеличение количества ядер или повышение их производительности. куда там линусу нужен условный флоат вчистой логике плохо видно. авх512 и устроен под улучшение скорости флоата вразы быстрее авх2. но линусу похоже трудно напрограмить полезностей на и быстром флоате - потому и ноет. Добавление от 11.12.2021 13:53: во - запилил тестилку полезной хардварной фичи - мошн естиматора из дх12 - https://drive.google.com/file/d/1-lKHBp0I4_6JyATl-Py2qIPYPNPTWuxH/viewпо слухам должна находить естиматор в AMD Radeon RX 5000 series or greater, Ryzen 2xxxx series or greater Intel Tiger Lake, Ice Lake, Alder Lake (from early 2022) NVIDIA GeForce GTX 10xx and above, GeForce RTX 20xx and above, Quadro RTX NVIDIA RTX соотв под этот хардварный вспомогательный костыль мож в 2022 будет заточен мод мвтулс и будет помогать в деле дегрейна. и мож в других. при нахождении показывает мин и мах размер кадра под работу и флаги размеров блока и точности. когда нету - то везде 0. |
DTL Member | Filin74 для этого нужна более еще более быстрая память. Это кэш процессора. Там тоже 3 уровня. но тама щас нету фул асоц. бо фул асоц кеша стоит дорого и жрет много ватов. и могет большее тормозить при ограничении количества сложности (цены и ватов). и жалки 8..16 вей сеты весьма просто оверлоаднуть при видимопроцессинге 2д или просто многокадриков. практически то размер гарантировано рандомных кеширований равен размеру сета вместо размеру цел кешу. Ну и при использовании оперативной памяти используются HUGE (LARGE) PAGE. че-та вночи придумало себя - надо же к 2мб выровненым алокейшенам лардпейджей тоже добавлять рандомный оффсет иначе 2д видимопроцессинг между одинаковыми кусками разных кадриков будет перегружать сет кеша при превышении количества веев. и потом или тречить офсет у себя перед фриингом или просто чистить указатель до размера 2мб гранулярности. |
Filin74 Member 1609/9799 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | Ничего я не понял. Меня интересует будут ли программы, требующие большого количества видеопамяти, работать на встройке интел. А то монтажеры с голодухи уже GT730 4гб ищут под вегасы и давинчи разные. Sergey 1400 на райзене вроде максимум 2гб может выделить. |
z2003 Member | del Исправлено: z2003, 13.12.2021 20:02 |
Filin74 Member 1610/9800 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | Я вашу мысль вообще не уловил. Чего сказать хотели. А цитату того человека я приводил. Его скорости устраивают. Тут вопрос большей целесообразности. Добавление от 13.12.2021 16:41: Видимо, мысль в том, что ископаемых у нас меньше, чем вы думали. Не готов об дискутировать. z2003+1 |
Sergey 1400 Member 1524/1585 ответов, #13 в рейтинге 20 лет на iXBT, с марта 2005 Чаще пишет в "Видеозахват" (90%) Россия Web-страница | Некоторые, ИМХО, поверхностные размышления по поводу видеокарт. А какие видеокарта вообще задачи выполняет? 1. Занимается отрисовкой интерфейса. При этом требуются некоторые аппаратные услуги по ускорению 2/3 D со стороны видеокарты. И если программы с интерфейсом на основе штатных библиотек системы со штатными кнопками, чекбоксами, слайдерами и т.п. будет работать вполне себе отлично, то со своими, нестандартными элементами может уже и прилично подгрузить карту. Например, интерфейс современного Блендера GeForce 430, при наличии вполне бодрого процессора, уже не вывозит, наблюдается заторможенность. А она лишь в пару раз слабее чем 730я. 2. Декодированием видео. И это отлично. нужно лишь поглядывать что программа действительно декодирует видеокартой. 3. Кодированием видео. Недавно появилось ощущение, что к h264 и h265 в разрезе использования видеокарт, и их ценового диапазона, нужно относится как к разным мирам, 4. Параллельные вычисления на мощностях видеокарт. Интересно, что Blender на моей машине с RX550 в cycles считает в несколько раз медленнее, чем центральным процессором. А в третьем Блендере OpenCL вообще убрали. NVIDIA рулит. В древнее время ATI сделала кодек который на Radeon мог кодировать. Помню скорость была раза в 4 выше, хотя качество так себе. Возможность сделать софтовый кодек с использованием мощностей видеокарты (не путать с кодированием встроенными в карту железками) вообще для CUDA упоминается, реализовано ли? В частности Давинчи чем кодирует, чисто микросхемой в видеокарте, или своим кодеком с использованием видеокарты, кто знает? 5. Использование видеокарты по прямому назначению для 3D расчетов. Отличный пример тот же Блендер. Рендер EEVEE считает через OpenGL чисто видеокартой, причем любой, не загружая основной ЦП, и это круто. |
Filin74 Member 1611/9801 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | Sergey 1400 4. Параллельные вычисления на мощностях видеокарт. Интересно, что Blender на моей машине с RX550 в cycles считает в несколько раз медленнее, чем центральным процессором. Это зависит от алгоритма и профессионализма разработчика. Так, создатели криптовалюты XMR только с N-ой попытки смогли создать алгоритм, который программисты не смогли ускорить на картах. Пока по крайне мере. Жаль, что ffmpeg не умеет даже ресайзинг делать на GPU. А подобный софт есть. Но я считаю, что такие возможности должны быть опциональны. Есть мощная карта и много памяти - пожалуйста. Нет - жди на ЦПУ. У меня пример подобного софта есть. Но из другой сферы. Защита и восстановление данных. И такой подход разработчика я считаю очень профессиональным. |
Filin74 Member 1612/9802 ответов 7 лет на iXBT, с апреля 2017 99 фото на iXBT.photo Чаще пишет в "Тех. поддержка" (29%) Россия | Filin74 У меня пример подобного софта есть. Но из другой сферы. Защита и восстановление данных. И такой подход разработчика я считаю очень профессиональным. Вот скрин. Чем лучше железо - тем быстрее. Но работать будет на любом. Добавление от 13.12.2021 17:28: Впрочем, разработчики дорогого софта вправе полагать, что у купившего этот софт и компьютер не дешевый. А значит на программистах можно сэкономить и ограничиться кодом только под GPU.К сообщению приложены файлы: |
DTL Member | Filin74 GT730 4гб *ну тупыыыеее* (ц) . нада от максвела - а то от 745 гтх и большее. от максвела у нвидии уже вналичии вариант мошн естимейшн моды мпег кодера и то скоро мож прикручу к мвтулзам вместо маналайза на цпу и ваще помогает остальному оптикал флоу и многому важному др. ыыы - https://developer.nvidia.com/blog/an-introduction-to…optical-flow-sdk/ NVIDIA GPUs from Maxwell, Pascal, and Volta generations include one or more video encoder (NVENC) engines which provided a mode called Motion-Estimation-only mode. This mode allowed users to run only motion estimation on NVENC and retrieve the resulting motion vectors (MVs). десятку века или две ждали - и вот оно уже. 745 гтх с уже максвелом мона найти на развалах блохастых рынков от 2 тыщ вроде. Исправлено: DTL, 13.12.2021 21:48 |
ecSTASy Member 327/2335 ответов, #48 в рейтинге 13 лет на iXBT, с сентября 2011 Чаще пишет в "Стерео" (55%) Россия, Новгородская область | Sergey 1400 Декодированием видео видеокартой думаю только актуально будет на "тяжелых" кодеках. VP9, AV1 и т.д. Кодированием видео софтово на видеокартах думаю очень тяжело сделать. Ту же поддержку openCl в х264 сделали нехотя. Но все же часть расчетов можно перенести на видеокарту написав к командной строке к энкодеру х264 --opencl. Параллельные вычисления на мощностях видеокарт ради интереса попробовал в Topaz Video Enhance AI. Старая всеми забытая 1070 запросто уделывает двух пенсионеров в виде Xeon 2697v2. Посмотреть бы на новый энкодер от Нвидиа в плане H265 с B кадрами. В 1070 при сжатии постоянным квантом он удивил. Метрики не сильно отличаются от х265 слоу. Только процессором больше суток на два часа видео, на видеокарте 1,5 часа ... |
DTL Member | ecSTASy Ту же поддержку openCl в х264 сделали нехотя. странно почему та толпа рукожопов вокруг х264 тормозит с начала 2021 уже без прикрута мошн естимейшена на сообразных чипах. он у нвидии на купельной точности сразу. и уже в дх12 с начала 2021 в апи аднака - https://docs.microsoft.com/en-us/windows/win32/medfo…motion-estimation и на системе с гтх 1060 х264 уныло тормозит при кодировании на и5-9600к на скорости около рилтайма при фулхд - пичаль. Добавление от 13.12.2021 21:23: Filin74и при использовании оперативной памяти используются HUGE (LARGE) PAGE. ну типа очередной раунд попытки ларджпейджей в ависинфе с пофикшеным попаданием по одинаковых сетам кешей (при масивном межкадровом процессинге особливо) - https://github.com/DTL2020/AviSynthPlus-LP-mod/releases/tag/3.7-01 теперь вместо фапаний на майнеры можна во вполне православном ависинфовом деле заценить каково оно получить годно количество ларджпейджей у разных виндовсов и грустить от отсутствий тама билд ин дефрагментаторов рамы. вин7 х64 в сейфмоде и при 4 гб рамы вроде дает чуть более полгига ларджпейжей после ребута. |
ecSTASy Member 328/2336 ответов, #48 в рейтинге 13 лет на iXBT, с сентября 2011 Чаще пишет в "Стерео" (55%) Россия, Новгородская область | DTL странно почему та толпа рукожопов вокруг х264 Они сразу же сказали, что под видеокарты ни чего оптимизировать не будут. Единственное исключение lookahead по просьбе AMD. На счет рукожопов Или спросите у них, там есть разработчики говорящие на русском на сколько я знаю... и на системе с гтх 1060 х264 уныло тормозит при кодировании на и5-9600к на скорости около рилтайма при фулхд - пичаль. У меня два Xeon 2697v2 + 1070. FPS 5-8. Командная примерно так выглядит +- : -level 4.1 --preset placebo --crf 18 --deblock -3:-3 --ref 5 --merange 32 --rc-lookahead 250 --opencl --threads 72 |