Последние темы Поиск
Общие форумы
Форумы поддержки портала iXBT.com
Специализированные форумы
ПроцессорыРазгон и охлаждениеСистемные платыМодули памятиВидеосистемаКриптовалюты, майнинг, blockchain-технологии, NFTИскусственный интеллект: технологии, практика, развитиеTV- и FM-тюнеры, видеовход, видеовыходЦифровое видео: захват, монтаж, обработкаМониторы и другие устройства отображенияЦифровое фотоБеспилотные летательные аппаратыЦифровой звукProAudio: Профессиональное звуковое оборудованиеСтереосистемыДомашний кинотеатр: проигрыватели и источники сигналаДомашний кинотеатр: аудиосистемаДомашний кинотеатр: ТV и проекторыМагнитные и SSD накопителиОптические носители информацииСетевые носители информацииПериферияКорпуса, блоки питания, UPSСети, сетевые технологии, подключение к интернетуСистемное администрирование, безопасностьСерверыНоутбуки, нетбуки и ультрабукиПланшеты и электронные книгиМобильные телефоны, смартфоны, кпк, коммуникаторыМобильные гаджетыОператоры и технологии мобильной связиТелефония, телекоммуникации, офисные АТСБытовая техника
Программы
Игры
Авторские форумы
Прочие форумы
Архивы конференции
Архив "О Конференции"Архив "Процессоры"Архив "Разгон и охлаждение"Архив "Системные платы"Архив "Модули памяти"Архив "Видеосистема"Архив "Видеозахват"Архив "Мониторы и другие устройства отображения"Архив "Цифровое изображение"Архив "Цифровой звук"Архив "Периферия"Архив "Корпуса, блоки питания, UPS"Архив "Коммуникации: сети и сетевые технологии"Домашний интернет, модемы (архив)Архив "Системное администрирование, безопасность"Архив "Мобильная связь"Программы Microsoft: Windows, Office, Server, Windows LiveАрхив "OС и системное ПО"Архив "Программы: Интернет"Архив "Программирование"Форум прикладных программистовАрхив "Электронные устройства и компоненты"Архив "Околокомпьютерный Флейм & Общий"Архив "Полемика (Злобный Флейм)"Околоавтомобильный ФлеймФорум ремонтниковВопросы компании IntelФотокамеры SamsungФорум о магазине приложений RuStoreФорум по продукции компании Huawei
Справка и сервисы
Другие проекты iXBT.com
Кураторы: MikeMac, RU_Taurus, archa
Страницы:Кликните, чтобы указать произвольную страницуназад123130131132133134135136137138139140171172173далее
Chudik: NAS своими руками (часть 8)
Обязательно читаем первую страницу. Вопросы, не отвечающие требованиям, могут быть проигнорированы.
MikeMac
Member
Куратор темы
2386/3714 ответов
16 лет на iXBT, с февраля 2009
Чаще пишет в "Накопители" (54%)
Россия, Москва
Web-страница
Инфо
MikeMac MemberКуратор темы
11 лет назад / 04 декабря 2013 00:02
jenci
как и проводов питания в наших краях за 182 руб найден BitFenix Molex to 4 x SATA.
800x532, 91.7Kb
jenci
Member
316/572 ответов
17 лет на iXBT, с июня 2007
12 фото на iXBT.photo
Чаще пишет в "Накопители" (51%)
Украина, Ужгород
Web-страница
Инфо
j
jenci Member
11 лет назад / 04 декабря 2013 00:24
MikeMac
в наших краях за 182 руб найден BitFenix Molex to 4 x SATA.
да, я первым делом пошел смотреть в ваш блог но потом вспомнил что у меня на БП молекса нет... нашел у себя в инетмагазинах "раздвоители" сата питания наверное куплю парочку когда попробую мой контроллер а-331 на совместимость и стабильность. а так теперишние все порты забиты дисками и к ним провода питания укомплектованы. нехватка только при экстренной ситуации.
Piwis
Junior Member
9/9 ответов
11 лет на iXBT, с ноября 2013
Инфо
P
Piwis Junior Member
11 лет назад / 04 декабря 2013 01:10
RU_Taurus
Переставил систему. Backup 1tb происходил при средней скорости 50Mb/s. Пересоздал zfs pool:
nas4free: ~ # zpool status
pool: data
state: ONLINE
scan: none requested
config:

NAME STATE READ WRITE CKSUM
data ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
gpt/WD-WMC1T1576554 ONLINE 0 0 0
gpt/WD-WCAZAF850805 ONLINE 0 0 0

errors: No known data errors
dd дал результат 93-95 мб/с (не помню точно). Восстановил с бэкапа. Скорость также была 50мб/с. решил сделать dd и выложить сюда:
nas4free: ~ # dd if=/dev/zero of=/mnt/data/Data/file.tst bs=1m count=5000
5000+0 records in
5000+0 records out
5242880000 bytes transferred in 71.539939 secs (73286056 bytes/sec)
Делал 3 раза, результаты каждый раз разные: 70......, 77...... bytes/sec
При этом dd на ufs диске в этой системе:
nas4free: ~ # dd if=/dev/zero of=/mnt/system/file.tst bs=1m count=5000
5000+0 records in
5000+0 records out
5242880000 bytes transferred in 56.957488 secs (92049004 bytes/sec)
iperf:
nas4free: ~ # iperf -c 192.168.1.35 -P 1 -i 1 -p 5001 -f M -t 10 -w 64K
------------------------------------------------------------
Client connecting to 192.168.1.35, TCP port 5001
TCP window size: 0.06 MByte (WARNING: requested 0.06 MByte)
------------------------------------------------------------
[ 3] local 192.168.1.34 port 61822 connected with 192.168.1.35 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0- 1.0 sec 53.9 MBytes 53.9 MBytes/sec
[ 3] 1.0- 2.0 sec 103 MBytes 103 MBytes/sec
[ 3] 2.0- 3.0 sec 102 MBytes 102 MBytes/sec
[ 3] 3.0- 4.0 sec 102 MBytes 102 MBytes/sec
[ 3] 4.0- 5.0 sec 101 MBytes 101 MBytes/sec
[ 3] 5.0- 6.0 sec 102 MBytes 102 MBytes/sec
[ 3] 6.0- 7.0 sec 102 MBytes 102 MBytes/sec
[ 3] 7.0- 8.0 sec 102 MBytes 102 MBytes/sec
[ 3] 8.0- 9.0 sec 101 MBytes 101 MBytes/sec
[ 3] 9.0-10.0 sec 101 MBytes 101 MBytes/sec
[ 3] 0.0-10.0 sec 969 MBytes 96.9 MBytes/sec
c:\iperf>iperf -c 192.168.1.34 -P 1 -i 1 -p 5001 -f M -t 10 -w 64K
------------------------------------------------------------
Client connecting to 192.168.1.34, TCP port 5001
TCP window size: 0.06 MByte
------------------------------------------------------------
[ 3] local 192.168.1.35 port 51817 connected with 192.168.1.34 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0- 1.0 sec 92.4 MBytes 92.4 MBytes/sec
[ 3] 1.0- 2.0 sec 104 MBytes 104 MBytes/sec
[ 3] 2.0- 3.0 sec 102 MBytes 102 MBytes/sec
[ 3] 3.0- 4.0 sec 103 MBytes 103 MBytes/sec
[ 3] 4.0- 5.0 sec 103 MBytes 103 MBytes/sec
[ 3] 5.0- 6.0 sec 103 MBytes 103 MBytes/sec
[ 3] 6.0- 7.0 sec 103 MBytes 103 MBytes/sec
[ 3] 7.0- 8.0 sec 102 MBytes 102 MBytes/sec
[ 3] 8.0- 9.0 sec 103 MBytes 103 MBytes/sec
[ 3] 9.0-10.0 sec 104 MBytes 104 MBytes/sec
[ 3] 0.0-10.0 sec 1020 MBytes 102 MBytes/sec
Скорость копирования с сервера на клиента - 74мб/с (zfs) 58мб/с (ufs) на файле 2 гига.
Скорость копирования с клиента на сервер (zfs) - 55мб/с на том же файле. Копирует половину быстро и замирает.
Скорость копирования с клиента на сервер (ufs) - 43мб/с на том же файле.

Стало, конечно, гораздо лучше, но не понятна суть происходящего. Почему, например, скорость dd понизилась? При таком высоком результате dd на ufs, копирование на него по сети медленнее, да и внутри сервака с zfs на ufs 55мб/с, а с ufs на zfs 65мб/с?
Есть смысл ещё что-то крутить?)
p.s.Спасибо за терпение!))
RU_Taurus
Member
Куратор темы
5681/11419 ответов
15 лет на iXBT, с марта 2009
22 фото на iXBT.photo
Чаще пишет в "Накопители" (49%)
Россия, Ульяновск
Инфо
R
RU_Taurus MemberКуратор темы
11 лет назад / 04 декабря 2013 01:25
Piwis
raidz1-0 ONLINE 0 0 0
gpt/WD-WMC1T1576554 ONLINE 0 0 0
gpt/WD-WCAZAF850805 ONLINE 0 0 0

Покажите zpool history. Мне крайне любопытно как вы делаете raidz из двух дисков.
jenci
Member
317/573 ответов
17 лет на iXBT, с июня 2007
12 фото на iXBT.photo
Чаще пишет в "Накопители" (51%)
Украина, Ужгород
Web-страница
Инфо
j
jenci Member
11 лет назад / 04 декабря 2013 01:34
Piwis
на файле 2 гига
кэш переполнился, началась запись... можно проверить gstat-ом, но его вроде нет в сборке nas4free. из-за этого меньше скорость копирования на диск ufs. там кеш меньше по скольку нету свободной памяти для него. надо бы проверить при копировании загрузку проца, может он не справляется?
тут говорили не давно про то что G2020 "хватает" для zfs. данные с http://www.cpubenchmark.net
Intel Pentium G2020 @ 2.90GHz           2789
AMD Athlon 64 X2 Dual Core 5200+ 1361
Xmm...
Member
41/1664 ответов
21 год на iXBT, с сентября 2003
Чаще пишет в "Политика" (37%)
Инфо
X
Xmm... Member
11 лет назад / 04 декабря 2013 04:54
Сделал себе NAS на Nas4Free (конфигурацию, если надо, опишу подробно). Скорость трансфера файлов по гигабитной сети вроде более-менее приличная, а вот время доступа несколько удручает. При заходе в директорию аппарат "задумывается" на пару секунд, а если файлов много - может и до десятка секунд доходить.

С чем это может быть связано? atime в свойствах датасета отключен.
aLEXXOiD
Member
49/115 ответов
15 лет на iXBT, с апреля 2009
Чаще пишет в "Накопители" (42%)
Инфо
a
aLEXXOiD Member
11 лет назад / 04 декабря 2013 06:30
VaZoR

P.S.S. Так поведаете, все таки свое решение ?
Дак EFI SHELL и есть. Для меня это было открытием, а все уже знают Просто в моей системе шела кк такового не было. Только возможность его вызвать из биоса. Пришлось искать сам шел, кидать его на флэшку с прошивкой для m1015.
RU_Taurus
Member
Куратор темы
5682/11420 ответов
15 лет на iXBT, с марта 2009
22 фото на iXBT.photo
Чаще пишет в "Накопители" (49%)
Россия, Ульяновск
Инфо
R
RU_Taurus MemberКуратор темы
11 лет назад / 04 декабря 2013 10:05
Xmm...
При заходе в директорию аппарат "задумывается" на пару секунд, а если файлов много - может и до десятка секунд доходить.
С чем это может быть связано?

Обсуждалось чуть ранее. Посмотрите здесь -> NAS своими руками (часть 7), #578
thedix
Member
82/94 ответов
11 лет на iXBT, с августа 2013
Чаще пишет в "Накопители" (63%)
Россия, Красноярск
Инфо
t
thedix Member
11 лет назад / 04 декабря 2013 10:29
В продолжение вчерашнего поста про RAIDZ2.
Увеличил количество дисков с данными до 16 и провел замеры для RAIDZ1 и RAIDZ2.
Конфигурация аналогична описанной выше.
### RAIDZ1
#disks total as9 % as12 % delta
3 (2+1) 2T 1.97T 1.5 1.97T 1.5 0T
4 (3+1) 3T 2.95T 1.67 2.86T 4.67 0.09T
5 (4+1) 4T 3.93T 1.75 3.93T 1.75 0T
6 (5+1) 5T 4.90T 2 4.72T 5.6 0.18T
7 (6+1) 6T 5.87T 2.17 5.80T 3.33 0.07T
8 (7+1) 7T 6.84T 2.29 6.63T 5.29 0.21T
9 (8+1) 8T 7.87T 1.63 7.87T 1.63 0T
10 (9+1) 9T 8.81T 2.11 8.75T 2.78 0.06T
11 (10+1) 10T 9.81T 1.9 9.62T 3.8 0.19T
12 (11+1) 11T 10.8T 1.82 10.5T 4.55 0.3T
13 (12+1) 12T 11.8T 1.67 11.4T 5 0.4T
14 (13+1) 13T 12.8T 1.54 12.2T 6.15 0.6T
15 (14+1) 14T 13.7T 2.14 13.1T 6.43 0.6T
16 (15+1) 15T 14.7T 2 14.0T 6.67 0.7T
17 (16+1) 16T 15.7T 1.88 15.7T 1.88 0T
### RAIDZ2
#disks total as9 % as12 % delta
4 (2+2) 2T 1.96T 2 1.91T 4.5 0.05T
5 (3+2) 3T 2.93T 2.33 2.91T 3 0.02T
6 (4+2) 4T 3.93T 1.75 3.93T 1.75 0T
7 (5+2) 5T 4.90T 2 4.59T 8.2 0.31T
8 (6+2) 6T 5.89T 1.83 5.60T 6.67 0.29T
9 (7+2) 7T 6.87T 1.86 6.75T 3.57 0.12T
10 (8+2) 8T 7.84T 2 7.50T 6.25 0.34T
11 (9+2) 9T 8.80T 2.22 8.25T 8.33 0.55T
12 (10+2) 10T 9.78T 2.2 9.00T 10 0.78T
13 (11+2) 11T 10.7T 2.73 10.5T 4.55 0.2T
14 (12+2) 12T 11.7T 2.5 11.3T 5.83 0.4T
15 (13+2) 13T 12.7T 2.31 12.1T 6.92 0.6T
16 (14+2) 14T 13.7T 2.14 12.9T 7.86 0.8T
17 (15+2) 15T 14.5T 3.33 13.7T 8.67 0.8T
18 (16+2) 16T 15.7T 1.88 15.7T 1.88 0T
где
#disks - количество дисков
total - теоретически доступный объём
as9 и % - свободное место и процент потерь при ashift=9
as12 и % - свободное место и процент потерь при ashift=12
delta - потери места при переходе с ashift=9 на ashift=12

Как видно из первой таблицы, правило "power of two plus parity" хорошо работает для RAIDZ1.
В случае RAIDZ2 не всё так очевидно, там минимальные потери идут при 4+2 и 16+2, при этом 8+2 даёт потери 6.25%.
В разных конфигурациях потери могут составлять до нескольких сотен гигабайт.

Отвечу на свой же вопрос:
пулы на RAIDZ1 и RAIDZ2 на одинаковом количестве дисков с данными (на считая чётность) будут иметь одинаковый размер?
В общем случае - нет.

UPD1.
Напомню, что данные цифры годятся только для примерной оценки потерь.
Диски создавались в VirtualBox размером в 1Тб двоичными (на самом деле, чуть больше - 1026,83 Гб).
Реальные диски имеют меньший размер.
Чтобы посчитать реальные диски, надо умножить размер из таблицы на коэффициент 0.907.
Полученный размер будет ближе к реальным цифрам, но с определенной погрешностью.
Проценты умножать не надо.

Например, RAIDZ2 8+2 при ashift=12 с дисками 2Тб даст свободного места:
7.50 * 2 * 0.907 = 13.605 Тб
Теоретически доступное свободное место:
16 * 0.907 = 14.512 Тб
Потери ZFS:
(14.512 - 13.605) * 1024 = 928.768 Гб

Исправлено: thedix, 04.12.2013 19:32

RU_Taurus
Member
Куратор темы
5683/11421 ответов
15 лет на iXBT, с марта 2009
22 фото на iXBT.photo
Чаще пишет в "Накопители" (49%)
Россия, Ульяновск
Инфо
R
RU_Taurus MemberКуратор темы
11 лет назад / 04 декабря 2013 10:36
thedix
Спасибо. Прекрасная работа.

thedix
В общем случае - нет.
ИМХО самое неприятное в истории с ashift 12 это то, что по мере заполнения пула количество "потерянного" объёма будет расти пропорционально количеству записанных файлов (метаинформации).
thedix
Member
83/95 ответов
11 лет на iXBT, с августа 2013
Чаще пишет в "Накопители" (63%)
Россия, Красноярск
Инфо
t
thedix Member
11 лет назад / 04 декабря 2013 10:59
RU_Taurus
по мере заполнения пула количество "потерянного" объёма будет расти пропорционально количеству записанных файлов (метаинформации)
Хм, вот это интересно бы проверить.
Вроде 1/64 места резервируется по нужды ФС, в том числе под метаданные.
Balda2000
Member
16/16 ответов
12 лет на iXBT, с февраля 2013
Беларусь
Инфо
B
Balda2000 Member
11 лет назад / 04 декабря 2013 11:04
jenci
кэш переполнился, началась запись... можно проверить gstat-ом, но его вроде нет в сборке nas4free.
таки есть

И ещё на нюанс наткнулся: при создании страйпа нужно ко всем дискам .nop делать (не только на первом), иначе на остальных будет ashift=9...
RU_Taurus
Member
Куратор темы
5684/11423 ответов
15 лет на iXBT, с марта 2009
22 фото на iXBT.photo
Чаще пишет в "Накопители" (49%)
Россия, Ульяновск
Инфо
R
RU_Taurus MemberКуратор темы
11 лет назад / 04 декабря 2013 11:05
thedix
Хм, вот это интересно бы проверить.
В коде zfs вообще много чего нужно посмотреть и проверить, т.к. "городских легенд" вокруг неё уже бессчётное множество.
Есть кстати англоязычный документ "ZFS on-disk format" и его вольная интерпретация от Юрия Воинова.

Добавление от 04.12.2013 11:08:

Balda2000
при создании страйпа нужно ко всем дискам .nop делать (не только на первом), иначе на остальных будет ashift=9...
Ashift не дискам назначается, а vdev-ам.
2012-07-08.23:00:12 zpool create -m /mnt -O atime=off -O checksum=fletcher4 -O utf8only=on TANK raidz2 
/dev/gpt/d3369.nop /dev/gpt/d5470 /dev/gpt/d3585 /dev/gpt/d5160 /dev/gpt/d5062 /dev/gpt/d6835
# zdb | grep ashift
ashift: 12
ashift: 12
Sergei V. Sh
Member
514/4573 ответов
20 лет на iXBT, с ноября 2004
2 фото на iXBT.photo
Чаще пишет в "Цифр.звук" (36%)
Россия, Екатеринбург
Инфо
S
Sergei V. Sh Member
11 лет назад / 04 декабря 2013 11:12
RU_Taurus
Покажите zpool history. Мне крайне любопытно как вы делаете raidz из двух дисков.
Я пробовал на nas4free - делается абсолютно непринужденно, никаких допключей и никаких сообщений при этом нету.
в history будет просто
zpool create tank raidz ada1 ada2
Oleg Pyzhov
Member
757/1053 ответов
15 лет на iXBT, с июня 2009
44 фото на iXBT.photo
Чаще пишет в "Накопители" (50%)
Россия, Санкт-Петербург
Инфо
Oleg Pyzhov Member
11 лет назад / 04 декабря 2013 12:27
SilverStone CP11 — очень тонкий кабель SATA, который можно подключить даже к разъему, прикрытому картой расширения
560x420, 34.5Kb

защелок не видно
Balda2000
Member
17/17 ответов
12 лет на iXBT, с февраля 2013
Беларусь
Инфо
B
Balda2000 Member
11 лет назад / 04 декабря 2013 12:44
RU_Taurus
Balda2000
при создании страйпа нужно ко всем дискам .nop делать (не только на первом), иначе на остальных будет ashift=9...
Ashift не дискам назначается, а vdev-ам.

2012-07-08.23:00:12 zpool create -m /mnt -O atime=off -O checksum=fletcher4 -O utf8only=on TANK raidz2
/dev/gpt/d3369.nop /dev/gpt/d5470 /dev/gpt/d3585 /dev/gpt/d5160 /dev/gpt/d5062 /dev/gpt/d6835
# zdb | grep ashift
ashift: 12
ashift: 12

Это RAIDZ , а я говорю про STRIPE.
Вот повторил в виртуалке:

zpool create tank /dev/gpt/virt1.nop /dev/gpt/virt2 /dev/gpt/virt3
zdb | grep ashift
ashift: 12
ashift: 9
ashift: 9
VDmitry
Member
308/968 ответов
20 лет на iXBT, с декабря 2004
77 фото на iXBT.photo
Чаще пишет в "Накопители" (30%)
Россия, Северная Родина Демократии :)
Инфо
V
VDmitry Member
11 лет назад / 04 декабря 2013 12:52
Balda2000
Праавильно: у вас страйп из 3х vdev-ов и получается
MikeMac
Member
Куратор темы
2387/3715 ответов
16 лет на iXBT, с февраля 2009
Чаще пишет в "Накопители" (54%)
Россия, Москва
Web-страница
Инфо
MikeMac MemberКуратор темы
11 лет назад / 04 декабря 2013 12:56

When writing to a RAID-Z vdev, ZFS may choose to use less than the maximum number of data disks. For example, you may be using a 3+2 (5 disks) RAID-Z2 vdev, but ZFS may choose to write a block as 2+2 because it fits better.
Oleg Pyzhov
защелок не видно - превосходные кабели miniSAS-4SATA тоже обходятся без защёлок на SATA. И попадались мне говнокабели с защёлками - так что не есть решающий признак.
RU_Taurus
Member
Куратор темы
5686/11428 ответов
15 лет на iXBT, с марта 2009
22 фото на iXBT.photo
Чаще пишет в "Накопители" (49%)
Россия, Ульяновск
Инфо
R
RU_Taurus MemberКуратор темы
11 лет назад / 04 декабря 2013 13:07
MikeMac
When writing to a RAID-Z vdev, ZFS may choose to use less than the maximum number of data disks. For example, you may be using a 3+2 (5 disks) RAID-Z2 vdev, but ZFS may choose to write a block as 2+2 because it fits better.
Это всё подтверждает
RU_Taurus

"динамический размер сегмента". На самом деле он динамичен лишь в рамках кратности размеру stripe, а не от ashift до 128Кb, как уверяет автор.
Power User
Member
877/2191 ответов
23 года на iXBT, с апреля 2001
Чаще пишет в "НАС" (54%)
Инфо
P
Power User Member
11 лет назад / 04 декабря 2013 13:17
Balda2000
да я тоже пару страниц назад делал страйп из 8 дисков, тоже пришлось гнопить все диски - иначе только первый ашифт12 становился (забыл написать про это, но это в принципе и логично - ашифт же не к диску относится, а к vdev-у)

MikeMac
цитата (http://constantin.glez.de/blog/2010/06/closer-look-z…erformance#raidz):
When writing to a RAID-Z vdev, ZFS may choose to use less than the maximum number of data disks. For example, you may be using a 3+2 (5 disks) RAID-Z2 vdev, but ZFS may choose to write a block as 2+2 because it fits better.

вот, вот это я и читал и потерял ссылку.....
где то (может тут... надо перечитать) еще писалось что даже на рейде-з-х может бытть выбрана запись миррором вместо контрольной суммы (если блоки очень маленькии или что-то в этом роде...)

отсюда можно сделать вывод что даже если 128 не дели тся на колличество дисков то будет записано не дробные блоки, а просто будут записаны не на все диски в в-деве...
Balda2000
Member
18/18 ответов
12 лет на iXBT, с февраля 2013
Беларусь
Инфо
B
Balda2000 Member
11 лет назад / 04 декабря 2013 13:20
VDmitry
Ну да... теперь я понял почему так получается... raidz - 1 vdev из 3-х разделов, а в stripe - каждый раздел как отдельный vdev входит... Для меня это было не очевидно... ещё недостаточно хорошо понимаю работу ZFS.
MikeMac
Member
Куратор темы
2388/3716 ответов
16 лет на iXBT, с февраля 2009
Чаще пишет в "Накопители" (54%)
Россия, Москва
Web-страница
Инфо
MikeMac MemberКуратор темы
11 лет назад / 04 декабря 2013 13:27
RU_Taurus
Это всё подтверждает да, логика чуть проясняется. Если бы они старались записать каждую запись на все диски - потери были бы при очень большом числе дисков чудовищными.

Есть кстати англоязычный документ "ZFS on-disk format"
RAIDZ там встречается полтора раза, причём
ashift ... This is currently '10' for a RAIDz configuration '9 'otherwise
ИМХО самое неприятное в истории с ashift 12 это то, что по мере заполнения пула количество "потерянного" объёма будет расти пропорционально количеству записанных файлов (метаинформации).

IMHO это два разных, суммирующихся, процесса - потери места на размазывание записи по нескольким дискам raidz и потери на мелких файлах и метаданных.

Я порядком погуглил и, похоже. вторая проблема как-то описана. А вот первой отцы-основатели не заморачивались (тк дисков на 4K не было). А современные контрибуторы не рискуют лезть в самую глубину движка.
jenci
Member
318/574 ответов
17 лет на iXBT, с июня 2007
12 фото на iXBT.photo
Чаще пишет в "Накопители" (51%)
Украина, Ужгород
Web-страница
Инфо
j
jenci Member
11 лет назад / 04 декабря 2013 13:31
thedix

### RAIDZ1
#disks total as9 % as12 % delta
5 (4+1) 4T 3.93T 1.75 3.93T 1.75 0T

спасибо вам! я хотел переделать на пул 4+1 на ashift: 9. хорошо что не сделал.
интересно а чем же вызвано такое существенное падение потерь при дисках >12?
RU_Taurus
Member
Куратор темы
5688/11430 ответов
15 лет на iXBT, с марта 2009
22 фото на iXBT.photo
Чаще пишет в "Накопители" (49%)
Россия, Ульяновск
Инфо
R
RU_Taurus MemberКуратор темы
11 лет назад / 04 декабря 2013 13:54
MikeMac
ashift ... This is currently '10' for a RAIDz configuration '9 'otherwise
Сделайте скидку на возраст документа он вышел еще во времена существования Sun.

MikeMac
потери места на размазывание записи по нескольким дискам raidz
Этот процесс, на примере, представляю так.
У нас есть гипотетический raidz 4+1. Размер full stripe = 128КБ, размер stripe на каждом диске = 32КБ (128 / 4 дата-диска). Допустим приложение пишет на диск блоками по 64КБ, тогда на каждый записанный блок данных zfs выделит 2 stripe с разных дисков и чётность запишет на третий. То есть весь "динамический размер сегмента" будет ограничен дискретным рядом 32, 64, 96 и 128КБ (плюс чётность на отдельный диск). Если же приложение захочет записать, пусть, 300КБ, то запишутся 2 full stripe и 2 stripe с потерей 52КБ в последнем.
thedix
Member
84/96 ответов
11 лет на iXBT, с августа 2013
Чаще пишет в "Накопители" (63%)
Россия, Красноярск
Инфо
t
thedix Member
11 лет назад / 04 декабря 2013 14:23
jenci
я хотел переделать на пул 4+1 на ashift: 9. хорошо что не сделал.
Да, вам этого делать не надо.
Владельцам 4+1 и 4+2 повезло больше всех.

интересно а чем же вызвано такое существенное падение потерь при дисках >12?
Сложно объяснить, никакой зависимости не прослеживается.
Меня особенно удивил вариант 8+2 с ashift=12, перепроверял два раза.

Добавление от 04.12.2013 14:27:

RU_Taurus
Этот процесс, на примере, представляю так.
Очень может быть.
Логично, что оставшийся хвост будет уложен в блок, кратный степени двойки., т.к. упрощается распределение свободных блоков.

Добавление от 04.12.2013 14:43:

Кстати, есть предположение, что странные цифры для RAIDZ2 объясняются особенностью применяемого алгоритма.
Напомню, что в RAIDZ1 применяется простой XOR, как в случае обычного RAID5.
Очевидно, что блок чётности будет иметь такой же размер, как и блок данных на каждом диске.
В случае 4+1 это будет 128К / 4 = 32К.
Для RAIDZ2 используется некий расширенный вариант избыточного кодирования Рида-Соломона.
Здесь присутствуют два блока чётности.
Честно говоря, не разбирался в деталях, но очень может быть, что блоки чётности имеют другой размер.
Это может объяснить такие пляски с цифрами.

Исправлено: thedix, 04.12.2013 14:44

Power User
Member
878/2192 ответов
23 года на iXBT, с апреля 2001
Чаще пишет в "НАС" (54%)
Инфо
P
Power User Member
11 лет назад / 04 декабря 2013 14:53
MikeMac
Если бы они старались записать каждую запись на все диски - потери были бы при очень большом числе дисков чудовищными.
это точно, учитывая все их рекомендации в стиле возьмем 24 зеркала, добавим охапку (штук 8) SSD на L2ARC и пучок (штуки 4) для ZIL'а, сдобрим все это 200ми гигабайтами РАМа и т.п....
зы. я же писал - файл делится на stripesize и записывается на столько vdev's сколько надо....

thedix
Меня особенно удивил вариант 8+2 с ashift=12, перепроверял два раза.
что там ? а то я как год назад себе сделал такой.... тогда безоговорочно считалось сдесь на форуме что ashift=12 самый кошерный.... счас выесняется что все таки потери в скорости не такие как пространстве (особенно учитывая, что у большинства упирается в гигабит, а почти 1 тера потерь на формате это 1 тера )

RU_Taurus
Этот процесс, на примере, представляю так.
я его вообще уже не представляю.... тут еще вмешивается такой фактор как компрессия (если датасет/пул настроен) - а там вообще муть мутная....
есть куча примеров где народ аналлизирует запись файлов с помощиью zdb -ddddddddddd (сколько там "d" и нахрена столько я не помню).... там можно посмотреть (на пустом пуле) - что куда и как записывается....

зы. с компрессией вообще не понятно? разбивается файл на блоки равные рекордсайзу, а потом они сжимаются ? ну так ясно, что всегда (если данные сжимаемые) будет меньше, и как тогда оно пишется - ведь оно сразу становится не кратно степени 2ки?....
или сжимается маленькими кусочками пока не наберется "целый" рекордсайз из уже сжатых ? или сжимается и проверяется влезет ли в предыдущий по размеру (64к) рекорд-сайз ?

Исправлено: Power User, 04.12.2013 15:10

Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Страницы:Кликните, чтобы указать произвольную страницуназад123130131132133134135136137138139140171172173далее
Последние обсуждения в Конференции
19:40Будет ли война России с Украиной? Политика
19:40ИИ - осознание себя? ИИ
19:39Слышите ли лично вы, разницу между FLAC, MP3, DSD? Стерео
19:39Отзывы о PrivalSystems (аналог skype) Интернет
19:39Fujifilm X-Pro, X-E, X-A, X-T, X-H - беззеркальные камеры со сменной оптикой и объективы Фуджи Фото
19:38Выбор электрического духового шкафа Бытовая техника
19:37Активация Windows XP в 2024 году (И далее). Или как переставить WINDOWS, не потеряв активацию? OС и сист. ПО
19:36Иммиграция. Как выжить за рубежом? Общий
19:32Выбор сыра Кулинария
19:30Вопросы домостроения Ремонт
19:29iXBT.photo: в 2025-м ресурс скорее всего будет закрыт. Судьба опубликованных на нём снимков пока неясна, но просим заблаговременно сохранить все свои фотографии. iXBT.com
19:29Обсуждение SSD Samsung Накопители
19:28Отечественные сериалы: обсуждаем, отслеживаем премьеры Кино
19:28CPU-флудилка Тесты CPU
19:27Поделитесь своим настроением. Какое оно у вас сейчас? Флуд
19:27Сделка века. Qualcomm собирается купить Intel Процессоры
19:27Апгрейд устаревшего компьютера Тех. поддержка
19:26PC и консоли, и вновь продолжается бой Игры
19:24Ребенок 13 лет хочет заняться программированием, есть вопросы Рынок труда
19:20Сервис оценки сообщений (ранее: сервис благодарностей) О Конфе
19:09Xcite — теперь всё: бывший завод Nissan закончил сборку раньше срока, Chery больше не присылает машинокомплекты, на стоянках пылятся до 10 000 готовых машин
18:53Вместо Chevrolet Cruze, Captiva и Opel Astra в России уже этим летом начнут выпуск новых машин. Бывший завод General Motors возобновляет работу
16:51КамАЗ нового поколения: стало известно, каким он будет
16:50Европейское космическое агентство запустило суперкомпьютер SpaceHPC с 5 петафлопсами для моделирования космических угроз
16:49Ростех построит уникальный радиогелиограф, который будет следить за солнечной активностью в трех спектральных диапазонах
16:34Texas Instruments выпустила микроконтроллер размером 1,6 х 0,86 мм с 32-битным Arm Cortex-M0+
16:20Теперь только с полным приводом, 2,0-литровым мотором, 8-ступенчатым «автоматом» и подножками. Представлен рамный внедорожник Haval H5 2025
16:02Прошивка One UI 7.0 наконец-то вышла для Samsung Galaxy S23, Galaxy S23 Plus и Galaxy S23 Ultra, но есть нюанс: это не финальная версия
15:50Наша Вселенная — порождение чёрной дыры другой Вселенной. Физики предложили объяснение, почему две трети галактик из ранней Вселенной вращаются по часовой стрелке
15:16Марс на связи: опубликованы самые свежие фото Марса, сделанные сегодня, 13 марта 2025 года, зондом Hera
20+ лет назад в этот день обсуждали
2001как в 98-й винде печатать на арабском и фарси? Прикладное ПО
20022-х портовый хаб Сети
2002Что случилось с БиЛайном? Моб. телефоны
2002XP Prof & NT4 domain, трабл с Right Click OС и сист. ПО
2002Проблема Интернет
2002Paragon CD-ROM Emulator & DVD Оптич. носители
2003Новые Торобреды-Б на 1.5v Разгон
2004Идальго: Погоня в пустыне / Hidalgo (2004) Кино
2005Sony CLIE PEG-NX70V Планшеты
2005Реле или аналоговый коммутатор? #2 Эл. устройства