Роман Опубликовано 7 июля, 2009 Поделиться Опубликовано 7 июля, 2009 У меня снова вопрос по автообработке файлов. Итак дано: несколько огромных .txt файлов необходимо разбить их на кучу маленьких скажем по 100кб. Как это грамотно в авто режиме сделать? да и не просто чтобы он обрубал текст на 100-м кб, а скажем искал первый символ "enter" (или тот символ который будет задан) после 100кб и резал там файл. Есть ли для этого умная софтина? Ссылка на комментарий Поделиться на другие сайты More sharing options...
Vinni Опубликовано 7 июля, 2009 Поделиться Опубликовано 7 июля, 2009 У меня снова вопрос по автообработке файлов. Итак дано: несколько огромных .txt файлов необходимо разбить их на кучу маленьких скажем по 100кб. Как это грамотно в авто режиме сделать? да и не просто чтобы он обрубал текст на 100-м кб, а скажем искал первый символ "enter" (или тот символ который будет задан) после 100кб и резал там файл. Есть ли для этого умная софтина? Скрипт на Перл строк на 20 - вот эта умная софтина. Роман, научись Perlу :smile3: Ссылка на комментарий Поделиться на другие сайты More sharing options...
Роман Опубликовано 7 июля, 2009 Автор Поделиться Опубликовано 7 июля, 2009 не люблю я "перловку" :( да и писать не хоца, вот и интересуюсь готовым решением Ссылка на комментарий Поделиться на другие сайты More sharing options...
ABM Опубликовано 7 июля, 2009 Поделиться Опубликовано 7 июля, 2009 Роман, попробуй _ttp://ab.vlink.ru/ForRoRo01.exe 1. Перепиши это модуль в папку с текстовым файлом. 2. Выполни ForRoRo01 Имя_Текстового_Файла Длина_Куска_в_КБ например, ForRoRo01 file01.txt 100 Сделал "отсечение" только по "Enter". Ссылка на комментарий Поделиться на другие сайты More sharing options...
Роман Опубликовано 8 июля, 2009 Автор Поделиться Опубликовано 8 июля, 2009 Алексей спасибо, а можно попросить сделать отсечение по "|", или лучше так - по умолчанию по "ентеру" а если в командной строке стоит символ, то по нему. Ну если это не сложно :) Ссылка на комментарий Поделиться на другие сайты More sharing options...
Роман Опубликовано 8 июля, 2009 Автор Поделиться Опубликовано 8 июля, 2009 Хотя я удалил лишние энтеры и поставил их где надо и все решилось сами собой, но если всеже софт доработать, то будет очень полезный инструмент! Огромный респект Алексей! Ссылка на комментарий Поделиться на другие сайты More sharing options...
sss Опубликовано 8 июля, 2009 Поделиться Опубликовано 8 июля, 2009 Мы это делаем в Delphi с использованием компонента RegExp, но каждый раз под конкретную задачу - так точней (максимум полчаса работы). Параллельно этим же компонентом приводим к одному формату даты, номера документов и т.п. RegExp использует стандартный язык регулярных выражений. Ссылка на комментарий Поделиться на другие сайты More sharing options...
ABM Опубликовано 8 июля, 2009 Поделиться Опубликовано 8 июля, 2009 Роман, попробуй с третьим параметром. Если его не в хвосте куска, то отсеченние по ENTER/ Ссылка на комментарий Поделиться на другие сайты More sharing options...
Роман Опубликовано 8 июля, 2009 Автор Поделиться Опубликовано 8 июля, 2009 Алексей благодаря вам, в системе WebInsight появились документы Вестника государственной регистрации, и база СМИ :) И файлики получились аккуратно нарезанными :) пример - ]]>http://webinsight.r-techno.com/files/ru/ve...alaam-30750.txt]]> Большое THNX :smile21: Ссылка на комментарий Поделиться на другие сайты More sharing options...
ABM Опубликовано 8 июля, 2009 Поделиться Опубликовано 8 июля, 2009 Тогда, я эту утилиту убираю со своего ресурса. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Рекомендуемые сообщения
Заархивировано
Эта тема находится в архиве и закрыта для дальнейших ответов.