>а хоть один документик
>с Jane's Fighting Ships можете утянуть?
Я вот как раз это и качаю сейчас.
>Дело в следующем - если иметь
>несколько базовых URL то фотографии
>можно тянуть
>(я просто перебираю все возможные :))
Угу, я догадался. :)
>Проверьте пожалуйста можно ли утянуть PDF
>зная его URL.
PDF я сделал. У Джейнс все разбито на HTML по десять линков н статьи на каждой странице. И единственное чем это можно скачать - Adobe Acrobat. Перепробовал много чего другого но все бестолку.
Я просто не понял как у них защита сделана
- после авторизации выдается некий дивный URL
с которого уже можно работать.
Или постоянно идете передача session id
или еще чего.
Можете дать начальный URL для
Fighting Ships например?
кстати из первых 1000 URLS примерно 480
вхождений (я сами картинки не качаю а просто проверяю
на 200) - похоже их больше чем в вашем PDF :(
(это я про Jane's Naval Weapon Systems)
>Я просто не понял как у них защита сделана
>- после авторизации выдается некий дивный URL
>с которого уже можно работать.
Работает так: мой комп на работе из Филадельфии подключается к файрволлу в Сиэттле, тот подключается к серверу Джейнс, оттуда идет запрос на license назад на файрволл и на боинговский license сервер, ответ идет обратно Джейнс, и т.д. Нагромоздили короче всего много. Если-бы пароль или по IP адресу то проблем бы не было.
>кстати из первых 1000 URLS примерно 480
>вхождений (я сами картинки не качаю а просто проверяю
>на 200) - похоже их больше чем в вашем PDF :(
>(это я про Jane's Naval Weapon Systems)
Фотографии у них организованны не по принципу что директория соответствует определенной публикации. Там навалено всего много в разных местах а инфа о том что где находится добывается из базы данных. Поэтому вы накопали больше фоток чем в моем PDF.