Последние темы Поиск
Общие форумы
Специализированные форумы
ПроцессорыРазгон и охлаждениеСистемные платыМодули памятиВидеосистемаTV- и FM-тюнеры, видеовход, видеовыходЦифровое видео: захват, монтаж, обработкаМониторы и другие устройства отображенияЦифровое фотоБеспилотные летательные аппаратыЦифровой звукProAudio: Профессиональное звуковое оборудованиеСтереосистемыДомашний кинотеатр: проигрыватели и источники сигналаДомашний кинотеатр: аудиосистемаДомашний кинотеатр: ТV и проекторыМагнитные и SSD накопителиОптические носители информацииСетевые носители информацииПериферияКорпуса, блоки питания, UPSСети, сетевые технологии, подключение к интернетуСистемное администрирование, безопасностьСерверыНоутбуки, нетбуки и ультрабукиПланшеты и электронные книгиМобильные телефоны, смартфоны, кпк, коммуникаторыМобильные гаджетыОператоры и технологии мобильной связиТелефония, телекоммуникации, офисные АТСБытовая техника
Программы
Игры
Авторские форумы
Прочие форумы
Форумы поддержки портала iXBT.com
Архивы конференции
Архив "О Конференции"Архив "Процессоры"Архив "Разгон и охлаждение"Архив "Системные платы"Архив "Модули памяти"Архив "Видеосистема"Архив "Видеозахват"Архив "Мониторы и другие устройства отображения"Архив "Цифровое изображение"Архив "Цифровой звук"Архив "Периферия"Архив "Корпуса, блоки питания, UPS"Архив "Коммуникации: сети и сетевые технологии"Домашний интернет, модемы (архив)Архив "Системное администрирование, безопасность"Архив "Мобильная связь"Программы Microsoft: Windows, Office, Server, Windows LiveАрхив "OС и системное ПО"Архив "Программы: Интернет"Архив "Программирование"Форум прикладных программистовАрхив "Электронные устройства и компоненты"Архив "Околокомпьютерный Флейм & Общий"Архив "Полемика (Злобный Флейм)"Околоавтомобильный ФлеймФорум ремонтниковВопросы компании IntelФотокамеры SamsungФорум о магазине приложений RuStoreФорум по продукции компании Huawei
Справка и сервисы
Другие проекты iXBT.com
ValkII: Чем разрезать на куски/редактировать большой файл типа *.txt? ну оочень большой!
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 04 апреля 2005 22:47
Объем файла порядка 700 метров и более.
Задача:
1. Разрезать на заданные(произвольного объёма, например пополам или в определённой точке) фрагменты.
2. Редактировать "как есть".

Не хочется сползать к прогам типа "мультиэдит". Да и не уверен, что она переварит такой файл.
spliner
Member
3926/7398 ответов
23 года на iXBT, с марта 2002
Чаще пишет в "Эл. устройства" (56%)
Россия, Ekaterinburg
Инфо Ответить
spliner Member
20 лет назад / 04 апреля 2005 23:03
ValkII
1.Total Commander - "разбить файл".
2. Как есть редактирует Far, вернее текстовый редактор в нем. Любого размера вроде.
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 04 апреля 2005 23:16
spliner

Любого размера вроде.
вот именно "вроде".

А "Тотал" не бьёт на заданные фрагменты......
spliner
Member
3927/7399 ответов
23 года на iXBT, с марта 2002
Чаще пишет в "Эл. устройства" (56%)
Россия, Ekaterinburg
Инфо Ответить
spliner Member
20 лет назад / 05 апреля 2005 00:43
ValkII. Ага - у всех бьет, а у вас не бьет.
Там надо ручками прописать нужный размер кусков, а не выбирать из списка.
С Far-ом советую попробовать. Чтоб "не вроде" было.
speedboy
Junior Member
67/76 ответов
20 лет на iXBT, с марта 2005
7 фото на iXBT.photo
Чаще пишет в "Тех. поддержка" (30%)
Инфо Ответить
speedboy Junior Member
20 лет назад / 05 апреля 2005 09:58
ValkII
только что попробовал из фара открыть 1.7Гб файл на редактирование. Открыть-то он его открыл, но медленно, поэтому лучше разбить.
John Z
unregistered
Ответить
J
John Z unregistered
20 лет назад / 05 апреля 2005 10:25
ValkII
Как это не бьет? Только что проверил на ТС версии 5.51 - настрогал в килобайтную лапшу файл. Чудненько порезало, красота!

Там просто нюанс - размер надо указывать в байтах :) И все получится. Задаешь 1000 - оно и крошит файлики в 1000 байт аккуратно...
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 05 апреля 2005 12:55
spliner
у всех бьет, а у вас не бьет
Бьёт как у всех - по размеру по другому Wcmd не умеет, к сожалению, а нужно в определённой точке - на заданной строке.

за идею с ФАР - спасибо

Отдельно спасибо speedboy за эксперимент.

не приходилось раньше пользоваться ФАРовским-редактором
правда у меня ФАР читает файл больше минуты да и интерфейс там далёк от совершенства....
пожалуй использую в случае безъисходки...

John Z ещё не настолько в тупике, чтоб пересчитывать заданную позицию в файле - в байты....

PS^ по ходу пьессы сообразил, есть такая замечательная штука - WinHex.

Всем спасибо.
unknown000
unregistered
Ответить
u
unknown000 unregistered
20 лет назад / 05 апреля 2005 14:28
В заданной строке значит ... :

А самому мелкую прогу для данной конкретной задачи разве так трудно написать - ведь не более 100 строк кода займет :)
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 06 апреля 2005 21:33
unknown000
WinHex - вполне достаточно....
Просто сначала тормознул чем "это" колбасить.....

.....ведь не более 100 строк кода займет
Стоит-ли по любому поводу хвататься за Борланд и т.д.?
Из пушки по воробьям..... ©
100 строк кода - некоторое время... плюс возможно отладка....
Не столь трудно - сколь бессмысленно.

Было совершенно ясно, что существует масса готового софта для решения вопроса....

To All

Кстати(проверил ради интереса): Не советую пользоваться для подобных манипуляций ФАР-редактором.... ну если только совсем времени не жалко.....

В итоге, наиболее эффективной оказалась связка: Tcmd(нарезка "заготовок")+WinHex(правка, независимо от размера и быстро).

Удачи всем!
DimaL
Member
27/77 ответов
20 лет на iXBT, с июня 2004
1027 фото на iXBT.photo
Чаще пишет в "Общий" (23%)
Инфо Ответить
D
DimaL Member
20 лет назад / 06 апреля 2005 21:43
Я в таких случаях пользуюсь WORD'ом, а в особо тяжёлых - WORD 5.0 for DOS.
valera13
Member
19/151 ответов
20 лет на iXBT, с августа 2004
Чаще пишет в "Политика" (90%)
Инфо Ответить
v
valera13 Member
20 лет назад / 06 апреля 2005 22:04
А разве нельзя открыть файл в Ворде, выделять нужные части текста, вырезать их в буфер обмена, и сохранять как новый файл? Или Ворд такую махину не откроет?
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 06 апреля 2005 23:24
DimaL
valera13
Даже и не знаю.....
Может это?
Это от Word2000
valera13
Member
20/153 ответов
20 лет на iXBT, с августа 2004
Чаще пишет в "Политика" (90%)
Инфо Ответить
v
valera13 Member
20 лет назад / 06 апреля 2005 23:46
ValkII , извини, хотелось помочь, но это было бы слишком просто, конечно ты пробовал так. Если бы у меня был такой здоровенный файл я бы таких "советов" не давал. Надеюсь найдешь решение.
Leo_I_M
Member
345/2404 ответов
22 года на iXBT, с мая 2002
Чаще пишет в "Общий" (19%)
Азербайджан, USSR.
Инфо Ответить
L
Leo_I_M Member
20 лет назад / 06 апреля 2005 23:55
Не знаю как 700 метров, но метров по 10-15 работает нормально TextEd 1.85a. Есть и более свежие, но мне именно этот нравится.
Ну, и Word пока ещё никто не отменял!
Alex Puff
Member
135/865 ответов
24 года на iXBT, с июня 2000
Чаще пишет в "Тех. поддержка" (16%)
Россия, Москва
Инфо Ответить
Alex Puff Member
20 лет назад / 07 апреля 2005 00:00
ValkII

Я в 1994 году такую проблему решал "Лексиконом"

Только там надо было не только порезать файл (слив из БД), но и поделить его на страницы в соответствии с содержанием, а потом распечатать на матричном принтере, разрезать на карточки и рассортировать... Файл был около 100 мб. Мы справились месяца за четыре круглосуточной работы. Умерли три принтера...
Leo_I_M
Member
346/2408 ответов
22 года на iXBT, с мая 2002
Чаще пишет в "Общий" (19%)
Азербайджан, USSR.
Инфо Ответить
L
Leo_I_M Member
20 лет назад / 07 апреля 2005 00:09
Alex Puff


Бедные... принтеры!
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 07 апреля 2005 00:11
Alex Puff
Я в 1994 году такую проблему решал "Лексиконом"
Тогда ещё "гиговые" проблемы не маячили....

А нам пришлось в 98-м распечатать 6000 ценников.... по 24 на страницу, тоже на матрицах и многие не по одному разу.....
Хитрожопый
unregistered
Ответить
Х
Хитрожопый unregistered
20 лет назад / 07 апреля 2005 11:22
А че это за текстовый файл на 700 метров? Война и Мир по моему 3 метра занимает...
ИА
Member
121/3876 ответов
21 год на iXBT, с августа 2003
Чаще пишет в "Общий" (21%)
Россия
Инфо Ответить
ИА Member
20 лет назад / 07 апреля 2005 11:38
Наверное база с проводками центробанка. Теперь и на бумаге.
andrey
unregistered
Ответить
a
andrey unregistered
20 лет назад / 07 апреля 2005 13:55
А чем WinRAR не подходит?
nikolas
Member
221/549 ответов
20 лет на iXBT, с июня 2004
Чаще пишет в "Общий" (39%)
Россия, Зеленодольск-Казань
Инфо Ответить
n
nikolas Member
20 лет назад / 07 апреля 2005 14:18
andrey
а WInRAR тут каким боком?
и как после него файлы редактировать?
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 07 апреля 2005 14:26
andrey
А чем WinRAR не подходит?

Эээ... Ну скажем: Назначением, функциями.....
А каким боком к такой задаче архиватор?
Akina
Member
1543/15340 ответов
25 лет на iXBT, с октября 1999
Чаще пишет в "OС и сист. ПО" (16%)
Россия, Зеленоград (Москва)
Инфо Ответить
A
Akina Member
20 лет назад / 07 апреля 2005 17:42
ValkII
1. Разрезать на заданные(произвольного объёма, например пополам или в определённой точке) фрагменты.
С произвольным объемом понятно - TCMD и прочие.
С заданной точкой ака номер строки - только прогу ваять... длины строк разные, понимаешь... впрочем прога плевая, и даже отлаживать не придется... вот скажем на VBA шинковка на куски по 10 тыс. строк

01open "filename.txt" for input as #1
02i=1
03while not eof(1)
04   open right("0000000" & trim(str(i)), 8) & ".txt" for output as #2
05   i=i+1
06   j=1
07   while j<10000
08      line input #1,tmp
09      print #2,tmp
10      j=j+1
11   wend
12   close #2
13wend
14close
15end
2. Редактировать "как есть".
а вот тут непонятка - bin-редактирование (запросто) или txt-редактирование (тяжело)?

Текстовых редакторов для работы с такими монстрами не припоминаю...
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 08 апреля 2005 00:14
To All
Вопроса уже нет! Есть только "некоторые рассуждения на тему"......
Проблема решена(в моём случае) ещё до сообщения №6..............

Akina
Рад видеть людей, которым не надо объяснять: Откуда такие файлы?

С заданной точкой ака номер строки - только прогу ваять... длины строк разные, понимаешь... впрочем прога плевая, и даже отлаживать не придется... вот скажем на VBA шинковка на куски по 10 тыс. строк
Спасибо за шаблон кстати, многим может пригодиться....
Нашинковать - не проблема..... Если исходить из конкретики(VBA и данной задачи в моём случае) - придется вводить туда "Файнд" или другие операторы и соответственно использовать другой алгоритм...
Идея с VBA - особенно актуальна в связи с дальнейшим импортом в "Аксесс"... Просто файл исходный немного "поправить" надо было.....

bin-редактирование (запросто) или txt-редактирование (тяжело)?
В WinHex эти грани весьма "размыты".

To All
Наблюдения:
(среда - 98SE, оперативка - 512)
1. Фар-редактор - тормозит безбожно. Границу "тормозов" не проверял(извините, интерфейс удручает).....
2. SkimEdit - не смотря на заявленные на сайте 2 гига - не смог вывести на экран результат..... (ожидание около 10 мин)
При работе с файлами около 100 метров - глючит.....
3. TextEdit - Почти полный аналог(интерфейс покрассимше) №2.....
4. Bred - Весьма проворно выдаёт "ошибка в среде". При работе с файлами до 100 метров(реальную границу не искал) - работает без вопросов.
5. AkelPad - выдает на экран результат, при попытке редактировать - отваливается(чёта там невозможно)... При работе до 100 метров - аналог "Bred".

6. Вне конкурса - WinHex:
Реального текстового режима нет(нельзя рассматривать как "текстовый редактор"). НО!
Вскрывает файл вне зависимости от размера, позволяет редактировать "всё и вся", при реальных операциях с файлом - задержка пропорциональна размеру файла(весьма небольшая).

Всем успехов!
DemonFromJupiter
Member
353/566 ответов
21 год на iXBT, с марта 2004
Чаще пишет в "Моб. телефоны" (37%)
Россия, Питер
Инфо Ответить
D
DemonFromJupiter Member
20 лет назад / 08 апреля 2005 09:02
ValkII
Я понимаю, что вопрос уже решен, но может это будет получше:
Есть еще редактор Vega. Работает с большими файлами, написано - до 2 Гб. Занимает жалких 8Кб в архиве. Интерфейс получше notepad'а.
http://maxtkhor.narod.ru/Soft/vega.zip
Akina
Member
1544/15342 ответов
25 лет на iXBT, с октября 1999
Чаще пишет в "OС и сист. ПО" (16%)
Россия, Зеленоград (Москва)
Инфо Ответить
A
Akina Member
20 лет назад / 08 апреля 2005 09:06
ValkII
В WinHex эти грани весьма "размыты".
нет. bin-редактирование - чистый overwrite (как diskedit или hiew), а txt-редактирование предполагает вставку-удаление байтов.

Добавление от 08.04.2005 09:07:

ValkII
Идея с VBA - особенно актуальна в связи с дальнейшим импортом в "Аксесс"... Просто файл исходный немного "поправить" надо было.....
я бы после импорта правил (собсно) так всегда и делаю.

не надо объяснять: Откуда такие файлы?
именно так - импорт в Аксесс - смотрю и анализирую логи. и 700 метров мне неудивительны...
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 08 апреля 2005 15:52
DemonFromJupiter
В принципе SkimEdit и Vega в некотором роде "родственники" http://skimsoft.com/?l=ru.
Подозревал, что "движок" у них общий, потому и не проверял...
Не всё так просто оказалось!
Vega - действительно вскрывает и полноценно правит такие файлы, по крайней мере размером до 1 гига...
При этом весьма умеренно свопится, в отличии от SkimEdit и других....

Akina

чистый overwrite - всего лишь вопрос прямого доступа к диску.....

И каким редактором будем тогда считать WinHex ?

WinHex заточен под бинарную правку. И такой например косвенный признак как дата изменения - стандартная опция....
Но это не мешает вставить или удалить байтик-другой....

я бы после импорта правил (собсно) так всегда и делаю.
Аксесс весьма чувствителен к организации данных при импорте, не любит отклонений. Часть информации при этом можно получить в виде Егог-тэйбл. Оно нам надо?


именно так - импорт в Аксесс - смотрю и анализирую логи. и 700 метров мне неудивительны...
без комментариев....
Akina
Member
1545/15348 ответов
25 лет на iXBT, с октября 1999
Чаще пишет в "OС и сист. ПО" (16%)
Россия, Зеленоград (Москва)
Инфо Ответить
A
Akina Member
20 лет назад / 08 апреля 2005 17:42
ValkII
Но это не мешает вставить или удалить байтик-другой....
Если редактирование сопровождается (или может) сдвижкой - это ТХТ-редактирование. Т.е. удалив или вставив байт в начале, вынужден переписывать весь файл. А BIN-редактирование - это изменение блока безотносительно к другим (сектора, кластера) - хаписываем только измененный блок.

Добавление от 08.04.2005 17:43:

ValkII
Аксесс весьма чувствителен к организации данных при импорте, не любит отклонений.
Импорт начинается просто - каждая строка в одно поле типа стринг, а далее парсим программно.
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 08 апреля 2005 21:11
Akina
Насчёт BIN:
Не буду спорить. Это скорее вопрос восприятия....
Есть прямая правка на диске без существенной привязки к неким объектам, есть работа с некоторой организованной структурой в виде файла.....
На мой взляд граница здесь, а лингво-юридическое толкование терминов второстепенно....


Импорт начинается просто - каждая строка в одно поле типа стринг, а далее парсим программно.
Это вариант для серьёзных неоднородностей. Согласен, не плохой.

Когда сбой серийный и легко устранимый (возникает например с лишними/двойными пробелами) проще локализовать заранее и втянуть готовую таблицу, "малой кровью" тэсэзэть....
1. Тянем "как есть".
2. Оцениваем навскидку характер ошибок.
3. Принимаем решение.... (в данном случае предкоррекция)

Ну не нраицца мне под каждую ситуацию плагин лепить. Это имеет смысл только при рутине или невозможности обойтись готовыми средствами.
мупфы
Member
370/730 ответов
23 года на iXBT, с февраля 2002
Чаще пишет в "Тех. поддержка" (59%)
Инфо Ответить
м
мупфы Member
20 лет назад / 10 апреля 2005 15:46
разбить, как было предложенно выше, ФАРом на приемлимые куски. А потом любым текстовым редактором из кусков слепить требуемые фрагменты.
Akina
Member
1546/15353 ответов
25 лет на iXBT, с октября 1999
Чаще пишет в "OС и сист. ПО" (16%)
Россия, Зеленоград (Москва)
Инфо Ответить
A
Akina Member
20 лет назад / 11 апреля 2005 09:45
ValkII
Это вариант для серьёзных неоднородностей. Согласен, не плохой.
Иногда - единственно возможный. Скажем логи IP-трафика - для разных типов пакетов (допустим TCP и ICMP) структура строк лога (после даты-времени) радикально различается.

Удобно тем, что обработка "сырого импорта" пишется для каждого типа файла ОДИН РАЗ. Потом просто отслеживаются исключения и, буде встретятся, корректируется парсинг... но на стандартизрванных структурах вроде логов это практически невозможно...
ValkII
unregistered
Автор темы
Ответить
V
ValkII unregistered Автор темы
20 лет назад / 19 апреля 2005 00:12
Akina
Иногда - единственно возможный. Скажем логи IP-трафика - для разных типов пакетов (допустим TCP и ICMP) структура строк лога (после даты-времени) радикально различается.
...достаточно ясна разница в формате ТСР и ICMP
В данном случае обрабатывался протокол уровня приложений...
Кстати, в отдельных случаях, можно "втянуть" ТСР и ICMP по разным правилам и... дальше понятно.


Удобно тем, что обработка "сырого импорта" пишется для каждого типа файла ОДИН РАЗ. Потом просто отслеживаются исключения и, буде встретятся, корректируется парсинг... но на стандартизрванных структурах вроде логов это практически невозможно...
А когда логи "пришлые"? Зачем это для "непредсказуемых" логов?
Да в общем и... "Сам себе ответил"

В сабжевой ситуации всё свелось к "сводной таблице" в Аксессе/Экселе. Поразительно легко отделался... А заодно и текстовые редакторы изучил.
Dr.Lion
unregistered
Ответить
D
Dr.Lion unregistered
13 лет назад / 16 ноября 2011 14:44
Akina, спасибо!
Выручили в очень подходящий момент!
Мегапрограммка, внукам буду показывать, настолько просто и изящно вопрос помогли решить

Исправлено: moderator-Bio, 16.11.2011 14:47

Ваш ответ:

Нет значка Нет значка Вот тут! Лампочка Восклицание Вопрос Класс! Улыбка Злость Огорчение Поговорим? Краснею Подмигивание Ругаю ОдобряюBIUdelSxsupxsuboffsp spoilerqurlimgvideo• list1. list1 codeprecenter-hr-rusQWE→ЙЦУ
файлыочистить
Ваше имя: илиАвторизуйтесь Предпросмотр В полную форму
вставить выделенную цитату в окно ответа
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).