Опубликовано

Скрипт для findISBN

Те кто увлекается собиранием книжек наверняка сталкивались с программой findISBN, которая ищет в книжках ISBN номера, а также название книги по ним в различных веб-библиотеках. В результате ее работы рядо с книжкой появляются  файлы с номерами ISBN и списком найденых названий.

Для того чтобы это собрать в одном CSV файле необходимую информацию и служит скрипт который был написам по просьбе Bill_G.

Его алгоритм.

Ищет все файлы с раширением ISBN, читает первые 4 сточки их него, потом берет 4 сточки из файла с расширением NameBook для этой книжки и первую строчку их файла txt для этой книжки. Из полученных данных форует сроку с разделитлем и пишет ее в файл.

В последствии этот файл можно где-нибудь обработать.

Сам скрипт: Скачать

Опубликовано

Начал формировать свою коллекцию книг (TBC)

Сегодня начал формировать свою коллекцию книг.

Первым этапом — обрабока скачанных библиотек (HomeLab,Infanata,Ihtnik и др.).

Задачи первого этапа:

  1. Убрать дубли и пересечении библиотек и сборок.
  2. получить обложку книжки (первая страница книги)
  3. Получить метаинформацию о файле
  4. Получить текстовый слой (при наличии)

Вторым этапом — описание книг. Описание будет браться из других библиотек и веб-сайтов.

Третим этапом попробую распознать некоторые книги на наличие дополнительной информации — описание, оглавления и т.п.

Опубликовано

Задумка Системы Управления Вебработами

На днях я задумался о системе, в которой можно было бы вести все свои веб-дела, и не просто — а совместно с другими людьми.

Подумав, я решил что напишу такую для себя. Часть уже готова. В ней есть:

  1. Управление пользователями
  2. Каталог сайтов
  3. Каталог доменных регистраторов
  4. Каталог хостингов
  5. Система Заданий (о ней подробнее ниже).

Что собираюсь сделать:

  1. Система событий с сайтов
  2. Централизованный бэкап
  3. Система контроля целостности файлов сайтов

Что такое система управления Заданиями?

В двух словах: Есть несколько человек, которые работают в группе над несколькими сайтами. Есть, допустим, программист, оптимизатор и контеншик. В данной системе можно регитрировать все действия которые делаются людьми и которые нужно сделать кем-либо, буть до необхдимые доработки, наполение сайта или что то еще. Например координатор может открыть задание на контенщика, чтобы тот добавил несколько статей на сайти и Задание на Программиста, чтобы тот доработал сайт или исправил какую-либо обнаруженную ошибку. Причем, человек видит только те Задания, которые он создавал сам или в которых он стоит одним из Исполнителей.

После создания Задания в нем можно фиксировать какие-то моменты и вести переписку по данному заданию.

В кратце все. 🙂

Постепенно система будет дорабатываться и совершенствоваться.

список заданийокно создания/редактирования задания

Опубликовано

Выносим граббер инфанаты на сервер.

Сегодня вынес скрипты граббинга инфанаты с локальной машины в интернет на хостинг. Это позволить постоянно мониторить появление новых описаний, да и увеличит скорость обращения к инфанате.

Опубликовано

Книгомания

Любите ли Вы читать книги? А читаете? А кто то еще любит и собирать их, коллекционировать, так сказать.

Я вот люблю, но пока я вижу трудноразрешаемую задачу — сортировка и описание.

Сортировка…. если книги взяты из нормального источника, то, как правило, они уже называются типа АВТОР-НАЗВАНИЕ_КНИГИ и это , к сожалению, обычно максимум. А название может быть создано и по шаблону, или вообще без названия (как при «рыбалке»). При наличии нормального занятия можно и отсортировать, но вот при его отсутствии еще книжу придется еще и открыть, найти название и переименовать файл.

Описание…. Под этим я понимаю извлечение всех данных книги (название, автора, издтельства, год издания, описания, оглавления и т.п.) Тут то и есть самое затратное дело.

По своему опыту я могу сказать что на описание книги нужно потратить минимум 2-3 минуты. Становится понятно что описание коллекции из 1000 книг займет минимум 2000-3000 минут, или 4-6 рабочих дня. А если коллекция 100 тыс книг, то это 400-600 рабочих дней, то есть исчисление идет на года.

Интересно, есть ли где нибудь база книг с нужными мне данными?  Первое что приходит в голову — natahaus, но тут можно напарсить не все параметры, например там нет оглавления, но это уже что-то.

Я думаю так.

1. напасить описния книг и сложить их в какой нить базе.

2. Начать наполнять сайт книгами (сайт уже есть — http://www.bookshelfs.ru). В процессе наполения и индексации сайта сайт нужно будет монетизировать — сапа, лиекс, может быть какой нить контекст. Это даст денег на хостинг, и в будущем можно будет нанять людей для описания книг.

Если человек тратит на 1 книгу 3 минуты, то за рабочий день можно сделать 20*8=160 книг. За неделю 160*5=800 книг. За месяц 800*4=2400 книг. За эту работу думаю можно заплатить 6-8 тысяч рублей. Таким образом описние одной книги будет стоить 10 рублей (лучше 8 рублей).

Перспектива какая — большое количство старниц в индексе — доход с контекста и бирж.

Конечно, все это размышления и жизнь внесет свои коррективы, но думаю что стоит попробовать.

Опубликовано

Совместный игровой сайт Поиграйте.ру — первые итоги

В полную силу взялся за раскрутку и продвижение сайта по партнерской программе gameboss.ru. Поскольку оптимизатор из меня никакой пока я скооперировался с Lenster-ом, кой взялся за его раскрутку.

Что было сделано для продвижения?

1. Оптимизровано расположение элементо на центральной  странице.

2. Оптимизировано описание последних игр под ключевые слова.

3. Добавлены рерайченые тексты под ключевые слова.

4. Закуплены ссылки в SAPE

Сегодня пошел 12-ый день.

Каковы же результаты:

Мы вышли в ТОП-30 по ключевому слову мини-игры и словили одну активацию игры. Пока конечно мы в минусе, но надеемся на перспективу. 🙂

Что дальше?

В данный момент ведется регистрация по каталогам и ждем апа.