Перейти к содержанию

Автоматическая обработка файлов


Рекомендуемые сообщения

У меня снова вопрос по автообработке файлов. Итак дано: несколько огромных .txt файлов

необходимо разбить их на кучу маленьких скажем по 100кб.

Как это грамотно в авто режиме сделать?

да и не просто чтобы он обрубал текст на 100-м кб, а скажем искал первый символ "enter" (или тот символ который будет задан) после 100кб и резал там файл.

Есть ли для этого умная софтина?

Ссылка на комментарий
Поделиться на другие сайты

У меня снова вопрос по автообработке файлов. Итак дано: несколько огромных .txt файлов

необходимо разбить их на кучу маленьких скажем по 100кб.

Как это грамотно в авто режиме сделать?

да и не просто чтобы он обрубал текст на 100-м кб, а скажем искал первый символ "enter" (или тот символ который будет задан) после 100кб и резал там файл.

Есть ли для этого умная софтина?

 

Скрипт на Перл строк на 20 - вот эта умная софтина.

 

Роман, научись Perlу :smile3:

 

 

Ссылка на комментарий
Поделиться на другие сайты

Роман, попробуй _ttp://ab.vlink.ru/ForRoRo01.exe

1. Перепиши это модуль в папку с текстовым файлом.

2. Выполни ForRoRo01 Имя_Текстового_Файла Длина_Куска_в_КБ

например, ForRoRo01 file01.txt 100

 

Сделал "отсечение" только по "Enter".

Ссылка на комментарий
Поделиться на другие сайты

Алексей спасибо, а можно попросить сделать отсечение по "|", или лучше так - по умолчанию по "ентеру" а если в командной строке стоит символ, то по нему.

Ну если это не сложно :)

Ссылка на комментарий
Поделиться на другие сайты

Хотя я удалил лишние энтеры и поставил их где надо и все решилось сами собой, но если всеже софт доработать, то будет очень полезный инструмент!

Огромный респект Алексей!

Ссылка на комментарий
Поделиться на другие сайты

Мы это делаем в Delphi с использованием компонента RegExp, но каждый раз под конкретную задачу - так точней (максимум полчаса работы). Параллельно этим же компонентом приводим к одному формату даты, номера документов и т.п. RegExp использует стандартный язык регулярных выражений.

Ссылка на комментарий
Поделиться на другие сайты

Алексей благодаря вам, в системе WebInsight появились документы Вестника государственной регистрации, и база СМИ :) И файлики получились аккуратно нарезанными :) пример - ]]>http://webinsight.r-techno.com/files/ru/ve...alaam-30750.txt]]>

 

Большое THNX :smile21:

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.

×
×
  • Создать...