Vinni Опубликовано 9 января, 2011 Поделиться Опубликовано 9 января, 2011 Благодарю за развернутый ответ. т.е. для начала узнаем: на самом ли деле он недоступен? А затем формируем последовательность.. Последовательность из тех чисел, что вы дали -- работает.. т.е. это все путь к документам. А как мне получать эту последовательность (напр. для любого другого сайта)?Какую прогу посоветуете?Если отвлечься от конкретного сайта.. Не так. Алгоритм для любого сайта выглядит примерно так 1) определить базовый URL для директории, где будете искать файлы (mmm.by/maker/price2xls) 2) определить шаблон имени файла (число) с помощью имени известного файла 3) определить признаки (ключевые строки в теле) того, страница является файлом, который вы ищете (а не ответом, что страницы с таким именем нет и т.д.) 4) определить список возможных вариантов имени файла (окрестности), среди которых будете искать файлы (числа от 1 до 4000-5000 это я с запасом) 5) в цикле для каждого варианта -сформировать URL на основе базовго URL и шаблона имени файла (mmm.by/maker/price2xls/1 и т.д.) -попытаться получить этот URL с веб-сервера -если такой URL существует (код ответа - 200) и он содержит признаки того, что это действительно нужная нам страница - сохранить файл Осталось только запрограммировать его хоть на ПХП, хоть на Перле, хоть на Питоне ;-)На Перле это строк 30 будет И такие вещи лучше делать через прокси ;-) Ссылка на комментарий Поделиться на другие сайты More sharing options...
keswa Опубликовано 10 января, 2011 Поделиться Опубликовано 10 января, 2011 Не так. Алгоритм для любого сайта выглядит примерно так 1) определить базовый URL для директории, где будете искать файлы (mmm.by/maker/price2xls) 2) определить шаблон имени файла (число) с помощью имени известного файла 3) определить признаки (ключевые строки в теле) того, страница является файлом, который вы ищете (а не ответом, что страницы с таким именем нет и т.д.) 4) определить список возможных вариантов имени файла (окрестности), среди которых будете искать файлы (числа от 1 до 4000-5000 это я с запасом) 5) в цикле для каждого варианта -сформировать URL на основе базовго URL и шаблона имени файла (mmm.by/maker/price2xls/1 и т.д.) -попытаться получить этот URL с веб-сервера -если такой URL существует (код ответа - 200) и он содержит признаки того, что это действительно нужная нам страница - сохранить файл Осталось только запрограммировать его хоть на ПХП, хоть на Перле, хоть на Питоне ;-)На Перле это строк 30 будет И такие вещи лучше делать через прокси ;-) Четкий, понятный ответ. Спасибо! Ссылка на комментарий Поделиться на другие сайты More sharing options...
Nissan Опубликовано 25 января, 2011 Поделиться Опубликовано 25 января, 2011 Вы тоже туда зашли?Надеюсь, не с рабочего компьютера. :rolleyes: Я другой сайт имел в виду. Штык, если это не nsa.gov, то какой процент вероятности, что на другой сайт зашел именно этот пользователь? Т.е., в целом, айпишник может принадлежать кому-то другому... Хочу исключить неподходящие варианты :) Или дайте подсказку, откуда он попал на тот, другой сайт? Ссылка на комментарий Поделиться на другие сайты More sharing options...
Штык Опубликовано 26 января, 2011 Автор Поделиться Опубликовано 26 января, 2011 Штык, если это не nsa.gov, то какой процент вероятности, что на другой сайт зашел именно этот пользователь? Т.е., в целом, айпишник может принадлежать кому-то другому... Хочу исключить неподходящие варианты :) Или дайте подсказку, откуда он попал на тот, другой сайт? Все до обидного просто: он зашел под тем же Ником, что и здесь. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Nissan Опубликовано 29 января, 2011 Поделиться Опубликовано 29 января, 2011 Все до обидного просто: он зашел под тем же Ником, что и здесь. Хм... Обычно в таких случаях пароль тоже используют такой же... Будучи администратором ресурса, имея доступ к БД и зная алгоритм шифрования, можно подобрать его. Ссылка на комментарий Поделиться на другие сайты More sharing options...
Рекомендуемые сообщения
Заархивировано
Эта тема находится в архиве и закрыта для дальнейших ответов.