gloky_koozdr (gloky_koozdr) wrote,
gloky_koozdr
gloky_koozdr

Category:

познавательная партизанщина. Ч.3. archive.org


В продолжение темы познавательной партизанщины (см. предыдущие две части: ч.1 и ч.2 ) - краткий псто о всем известном ресурсе archive.org. Замечательный и бесхитростный ресурс, но даже на нём есть пара фокусов, которые здорово облегчат "геронтобиблиофилу" работу.





#1 Книги оцифрованные google

На archive.org покоится лишь малая толика старых изданий оцифрованных гуглом, но зато их легко и приятно оттуда скачивать, не заморачиваясь с прокси-серверами и прочей унизительной лабудой. Если знать как.

Как? Всё очень просто. Открыв на архив-орг карточку нужной книги видим такое:



При нажатии на ссылку "PDF(Google.com)" происходит былинный отказ - нас просто перебрасывают на страницу книги на books.google.com, естественно закрытую для не американских IP.
Решается просто - всего лишь нажатием на ссылку "HTTP" (см. красную стрелку на картинке выше)
Наживаем, и видим вот такой список:



Красной стрелкой выделена строка с pdf-версией файла, который спокойно скачиваем щёлкнув правой кнопкой мыши, и далее, - "сохранить как..".

№2 Картинки в максимальном качестве.

Насколько я понял из своего опыта, как таковые pdf-книги на серверах huthi trust и archive.org не хранятся. Хранятся наборы графических файлов в jp2 и tiff, т.е. pdf по сути склеивается из них как-бы "налету". На archive.org этот самый пдф склеивается так, что хоть плачь, хоть смейся. Файл получается тяжелый, но при этом все изображения в нём "убиты" напрочь. Но мы-то с вами знаем, что на самом деле картинки там очень даже зер гут. Как заполучить исходные файлы с Хати траст было показано в предыдущей части. Практически то же самое, только намного удобнее и легче можно провернуть на архив-орг.
Опять же, всё совсем несложно.
Открываем книгу в режиме "reed online" (самая первая ссылка, над "download pdf"). Я лично для сбора картинок включаю режим миниатюр страниц. Видим примерно такое:



На интересующей картинке щёлкаем ПКМ, и "открыть изображение". Откроется махонькая картинка в jpeg, ровно такая же как и сама миниатюра. А теперь немножко камлаем - в частности меняем конец url-адреса картинки. В данном случае, url заканчивается на переменные "scale=26&rotate=0". Это означает что исходный файл jp2, лежащий на сервере уменьшен в 26 (!) раз. Меняем значение "scale" на о (ноль) и перезагружаем страницу. Картинка загрузится в полном исходном размере (в данном случае - ок. 750 кб и примерно 4000х2500 пикс), что очень даже неплохо. Формат правда не исходный (jp2), а jpeg, но это даже удобней, тем более что качество совершенно не отличается (единственно отличие - исходный jp2 заметно меньше весит). Кстати точно также можно менять переменную rotate (поворот), чтобы вывести "лежащие на боку" картинки с нужным поворотом (поменяв значение с нуля на 90 или 270).

Всё это наверняка все заинтересованные лица давно знают, но пускай будет, - так,"для коллекции".
Tags: archive.org, познавательная партизанщина
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 2 comments