Книгомания — парсер Инфанаты.

В предыдущем посте я озвучил проблему описания большого количества книг. Как один из путей повышения скорости описания я вскольз упоминул о возможности выдрать описания с какой либо онлайновской библиотеки, например, инфанаты. Что-ж, сказано — приступил к реализации.

Нам поможет знание php и mysql (можно и без нее, но с ней проще).

У меня получилось два скрипта. Первый — находит ссылки на все книжки на инфанате, тупо пролистывая каждую страницу и ищя в ней ссылку определенног оформата. Второй скрипт — выдирает по этим ссылкам описание, картинку и складывает их на диск или в базу (я пока еще не решил)

В данный момент находятся все книжки на инфанате (через несколько часов будет готово, т.к. работает скрипт локально на машине).

Завтра запущю процесс выдирания описания и картинок.

через некоторое время у меня будет уже готовенькая база. 🙂

ЕЕ я применю как помощник в описании своей коллекции.

После того как я все это проверю и заточю, я буду постоянно отслеживать появление новых книг и аккуратно сохранять информацию о них.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

CAPTCHA image
*