mnu

Только выйдя из дому, понимаешь, насколько огромен мир


Previous Entry Share Next Entry
mnu

Каталогизатор для ЖЖ

Друзья, а не подскажите какой-нибудь грамотный классификатор под ЖЖ? За восемь лет у меня в журнале скопилось столько материала, что найти что-либо "древнее" просто нереально. К тому же, движок ЖЖ позволяет листать постранично записи не старше двух последних лет, заставляя просматривать старые посты поодиночке. Стандартный ЖЖшный XML-экспорт не понимает теги и обратные ссылки к записям, вытаскивая только содержимое постов с датами и оглавлениями. Каким софтом разумнее всего вытянуть журнал на жесткий диск так, чтобы потом максимально автоматизированно сгенерировать HTML-странички с оглавлениями и привязками к записям? Если такое вообще в природе существует. Хочу сделать отдельные оглавления по алфавиту, странам и темам.

promo dima_chatrov january 1, 2005 00:00 14
Buy for 1 000 tokens
Остались последние места на 2018 год! Канада, Марокко, Новая Зеландия! Желающие присоединиться, пишите мне в skype (dimachatrov) либо на dchatrov@gmail.com

  • 1
mbashtan July 11th, 2011
немного не в тему, но сразу до старых записей можно достать дописав в адресе skip=100 и тп

dima_chatrov July 11th, 2011
Я в курсе, спасибо. Skip=380 заканчивается у меня в начале 2009 года, а журнал ведется с 2003.

serge_e July 11th, 2011
Посмотри на LJPMS - я им (кажется...) когда-то пользовался, по памяти, структуру в офлайне он создает.
http://ljsm.feechki.org/ljpms.html
Там еще ljsm упоминается, этот точно в html локально складывал

Из упоминаний о нем:
http://yablor.ru/blogs/bekap-suschestvuyuschego-jurnala-i-vosstanovlenie-zapisey-iz-zamorojennogo-jj/492577

dima_chatrov July 11th, 2011
Так про это я в посте и написал: с помощью LJPMS держу XML-вариант журнала в архиве, но он не понимает теги и URLы записей.

(Deleted comment)
dima_chatrov July 11th, 2011
Знаю, но неужели это все удобно? :)

infist_xxi July 11th, 2011
Есть скрипт ljsm - он позволяет вытянуть содержимое ЖЖ на жесткий диск, вроде даже с коментами, но структуру по тегам, конечно, не делает.

К сожалению оригинальная ссылка на сайт (http://www.offtopia.net/ljsm/) автора (http://ati.livejournal.com/) вроде как не работает. Информация о последней версии была тут: http://rulj.livejournal.com/532637.html Если нужно могу выслать на почту этот скрип если найду исходный архив.

infist_xxi July 11th, 2011
Ну, собственно, вам выше о нем и написали...

tunner July 11th, 2011
Да прекрати, нет таких фич в мире.

dima_chatrov July 11th, 2011
Если данные систематизированы, полдела уже сделано. Привязка - тег, например.

(Deleted comment)
(Deleted comment)
(Deleted comment)
(Deleted comment)
(Deleted comment)
(Deleted comment)
kufer July 11th, 2011
Читаю ЖЖ через RSS, Google Reader-ом. Достаточно ключевого слова и он найдет пост (внутри сервиса Google Reader) хоть по всем блогам, на которые этот ридер "читает" ( на которые настроен), хоть по какому-либо выбранному блогу. О-о-чень удобно. Вот так это выглядит https://lh5.googleusercontent.com/-iVrIxOF9grc/Ths_HvIbUcI/AAAAAAAAN2I/g536PwuqjIg/dshatrov.JPG

infist_xxi July 11th, 2011
А что конкретно вам надо от каталогизатора? Вы напишите, может что можно придумать - я все равно занимаюсь обдираловом ЖЖ в исследовательских целях :)

donna_laura July 11th, 2011
Полагаю, поставленная Димой задача актуальна и интересна не только ему.

disablement July 11th, 2011
offline explorer пробовал?

dima_chatrov July 11th, 2011
Что за зверь такой?

serge_yakovlev July 11th, 2011
Помнится мне, dolboeb как-то писал про архивацию ЖЖ. Поищи у него.

donna_laura July 11th, 2011
Архивация - это одно, а систематизация и удобный поиск по архиву - куда более сложный вопрос.

nik_and_tos July 11th, 2011
Может сейчас скажу прописную истину, но быстро посмотреть старые посты можно например так:

http://dima-chatrov.livejournal.com/2005 — весь 2005-й
http://dima-chatrov.livejournal.com/2005/11/ — Ноябрь 2005-го (чисто для примера) тут были бы видны темы записей если бы они были.

Функционал стандартный работает в любом журнале

dima_chatrov July 11th, 2011
Ну и много понятно из такой таблицы цифр? :) Нужен именно грамотный каталогизатор, чтобы человек мог сразу найти нужную запись.

annykey July 11th, 2011
я не пойму... тебе вытянуть весь жж с тегами и тд? это можно думаю решить
или каталгизатор автоматический?

dima_chatrov July 11th, 2011
Коль, смотри: ЖЖ с тегами мы уже вытянули (спасибо timon_timonich). Теперь думаю, на чем на маке написать базку для автоматической генерации оглавления, исходя из тегов и их группировки. Какой-нибудь FileMaker, наверное.



Edited at 2011-07-11 08:44 pm (UTC)

(Deleted comment)
timon_timonich July 11th, 2011
Да уже написали :)

za1chas July 11th, 2011
Да хуль там каталогизировать, всего 439 заметок, вот я их своим движком из кэша Яндекса поднял, есличо:

http://lleo.me/chatrov/contents?mode=more

dima_chatrov July 11th, 2011
Лень, жжешь! :)) А остальные 900 не индексированы?

  • 1
?

Log in

No account? Create an account