Ugine: Домашний архив статей/видео/аудио
Ugine
Member
Автор темы
2/1619 ответов
23 года на iXBT, с мая 2001
Чаще пишет Р Р† "Общий" (22%)
Инфо Ответить
U
Ugine MemberАвтор темы
11 лет назад / 14 марта 2014 00:42
Доброго времени всем.
Есть желание создать дома что-то вроде архива для хранения тех стоящих документов (статей, видеороликов, аудиозаписей), которые встречаются на просторах Интернета. Проблема в том, что данные (те же статьи) лежат в сети в разных форматах. Приведу пример: аналитическая статья на новостном ресурсе (как правило, это чистый текст, но бывают картинки/графики, а то и фотогалереи), блог на livejournal, заметки на facebook, pdf-документы и т.д..
Если тупо выдрать текст, то потеряется форматирование и интегрированные аудио/видео/фото элементы. Хранить ссылки - тоже не вариант, т.к. ресурсы переезжают/закрываются, какие-то ссылки перестают работать.

Было бы здорово скачать это все к себе, привести к единому формату и добавить тэги (чтобы работал поиск по ключевым словам).
Есть идеи, какими инструментами это можно было бы сделать?

Спасибо.
AWRR
Member
313/807 ответов
15 лет на iXBT, с февраля 2009
Чаще пишет Р Р† "Прикладное ПО" (55%)
Web-страница
Инфо Ответить
A
AWRR Member
11 лет назад / 14 марта 2014 01:35
Ugine
Расширение Scrapbook у Firefox
SergeCpp
Member
78/258 ответов
12 лет на iXBT, с марта 2012
Чаще пишет Р Р† "Культура" (36%)
Web-страница
Инфо Ответить
SergeCpp Member
11 лет назад / 14 марта 2014 02:00
Хранить ссылки — вполне себе вариант, только хранить нужно сохранённые ссылки. Сохранённые — где? В одном из веб-архивов, самое большое доверие — к машине времени (Wayback Machine, часть Internet Archive).

Как сохранить там ссылку? Очень просто, переходите по следующему адресу:
Смотреть сохранённые варианты — так:
Есть сохранённые так сайты, которых уж нет в сети.

Большой плюс — версионность, хранить можно хоть ежедневные копии страниц (а может и чаще).

Некоторые ссылки машина времени не сохраняет (учитывает robots.txt), тогда можно воспользоваться относительно новым archive.is, есть плюс: при сохранении страниц с сайтов Livejournal и Reddit происходит разворачивание скрытых комментариев.

У меня в Избранном есть две кнопки-ссылки для добавления текущей страницы (или активной /на которой "рамочка"/ ссылки на этой странице) в archive.is (код можно изменить для Wayback Machine при желании):
Скрытый текст

Вот, эту тему сохранил до своего ответа: http://archive.is/JKcgm

См. также: Archive Team — архивисты интернета.

Добавление от 14.03.2014 02:08:

А вот — эта тема, сохранённая уже после моего ответа: http://archive.is/izs18

Вот — все они, сохранённые (если ещё сохранить, будут в списке): http://archive.is/forum.ixbt.com/topic.cgi?id=23:44598
~wildwind~
Member
1402/6990 ответов
21 год на iXBT, с февраля 2004
Чаще пишет Р Р† "OС и сист. ПО" (26%)
Россия, Р В Р’В Р РЋРЎв„ўР В Р’В Р РЋРІР…
Инфо Ответить
w
~wildwind~ Member
11 лет назад / 14 марта 2014 15:46
Очередная идея на тему "скачать весь интернет".

Статьи (и другие страницы) можно сохранять вместе со всем содержимым (выбрать формат "Веб-страница, полностью"). Для сохранения аудио и видео есть расширения.

С поиском по ключевым словам вполне справляется встроенный поиск Windows.
Ваш ответ:

Список кодов форума
Список всех смайликов закрепить окно ответа
Нет значка Нет значка Р’РѕС‚ тут! Лампочка Восклицание Р’РѕРїСЂРѕСЃ Класс! Улыбка Злость Огорчение РџРѕРіРѕРІРѕСЂРёРј? Краснею Подмигивание Ругаю РћРґРѕР±СЂСЏСЋBIUdelSxsupxsuboffsp spoilerqurlimgvideo• list1. list1 codeprecenter-hr-rusQWE→ЙЦУ
файлыочистить
Ваше имя: Авторизуйтесь Предпросмотр В полную форму
вставить выделенную цитату в окно ответа
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).
Если Вы считаете это сообщение ценным для дискуссии (не обязательно с ним соглашаться), Вы можете поблагодарить его автора, а также перечислить ему на счет некоторую сумму со своего баланса (при отзыве благодарности перечисленная сумма не будет вам возвращена).
Также вы можете оценить сообщение как неудачное.
В течение суток можно 20 раз оценить сообщения разных участников (купите Premium-аккаунт, либо оплачивайте оценки сверх лимита).