Перейти к содержанию

Занимательный Практикум


Рекомендуемые сообщения

Благодарю за развернутый ответ.

 

т.е. для начала узнаем: на самом ли деле он недоступен?

А затем формируем последовательность..

 

Последовательность из тех чисел, что вы дали -- работает.. т.е. это все путь к документам. А как мне получать эту последовательность (напр. для любого другого сайта)?

Какую прогу посоветуете?Если отвлечься от конкретного сайта..

 

Не так.

Алгоритм для любого сайта выглядит примерно так

1) определить базовый URL для директории, где будете искать файлы (mmm.by/maker/price2xls)

2) определить шаблон имени файла (число) с помощью имени известного файла

3) определить признаки (ключевые строки в теле) того, страница является файлом, который вы ищете (а не ответом, что страницы с таким именем нет и т.д.)

4) определить список возможных вариантов имени файла (окрестности), среди которых будете искать файлы (числа от 1 до 4000-5000 это я с запасом)

5) в цикле для каждого варианта

-сформировать URL на основе базовго URL и шаблона имени файла (mmm.by/maker/price2xls/1 и т.д.)

-попытаться получить этот URL с веб-сервера

-если такой URL существует (код ответа - 200) и он содержит признаки того, что это действительно нужная нам страница - сохранить файл

 

Осталось только запрограммировать его хоть на ПХП, хоть на Перле, хоть на Питоне ;-)

На Перле это строк 30 будет

И такие вещи лучше делать через прокси ;-)

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 271
  • Создана
  • Последний ответ

Не так.

Алгоритм для любого сайта выглядит примерно так

1) определить базовый URL для директории, где будете искать файлы (mmm.by/maker/price2xls)

2) определить шаблон имени файла (число) с помощью имени известного файла

3) определить признаки (ключевые строки в теле) того, страница является файлом, который вы ищете (а не ответом, что страницы с таким именем нет и т.д.)

4) определить список возможных вариантов имени файла (окрестности), среди которых будете искать файлы (числа от 1 до 4000-5000 это я с запасом)

5) в цикле для каждого варианта

-сформировать URL на основе базовго URL и шаблона имени файла (mmm.by/maker/price2xls/1 и т.д.)

-попытаться получить этот URL с веб-сервера

-если такой URL существует (код ответа - 200) и он содержит признаки того, что это действительно нужная нам страница - сохранить файл

 

Осталось только запрограммировать его хоть на ПХП, хоть на Перле, хоть на Питоне ;-)

На Перле это строк 30 будет

И такие вещи лучше делать через прокси ;-)

 

Четкий, понятный ответ. Спасибо!

Ссылка на комментарий
Поделиться на другие сайты

  • 3 недели спустя...

Вы тоже туда зашли?

Надеюсь, не с рабочего компьютера. :rolleyes:

 

Я другой сайт имел в виду.

 

Штык, если это не nsa.gov, то какой процент вероятности, что на другой сайт зашел именно этот пользователь? Т.е., в целом, айпишник может принадлежать кому-то другому... Хочу исключить неподходящие варианты :)

 

Или дайте подсказку, откуда он попал на тот, другой сайт?

Ссылка на комментарий
Поделиться на другие сайты

Штык, если это не nsa.gov, то какой процент вероятности, что на другой сайт зашел именно этот пользователь? Т.е., в целом, айпишник может принадлежать кому-то другому... Хочу исключить неподходящие варианты :)

 

Или дайте подсказку, откуда он попал на тот, другой сайт?

 

Все до обидного просто: он зашел под тем же Ником, что и здесь.

Ссылка на комментарий
Поделиться на другие сайты

Все до обидного просто: он зашел под тем же Ником, что и здесь.

 

Хм... Обычно в таких случаях пароль тоже используют такой же... Будучи администратором ресурса, имея доступ к БД и зная алгоритм шифрования, можно подобрать его.

Ссылка на комментарий
Поделиться на другие сайты

Заархивировано

Эта тема находится в архиве и закрыта для дальнейших ответов.


×
×
  • Создать...