WebScrapBook — расширение браузера, позволяющее сохранять веб-страницы для просмотра офлайн в виде древовидной базы данных.
https://github.com/danny0838/webscrapbook
Это расширение доступно для браузеров на базе Chromium и Firefox и может быть установлено из соответствующего интернет-магазина.
Для функционирования WebScrapBook в Боковой панели браузера в режиме WYSIWYG (доступ через toolbar button > Open scrapbook), необходим предварительный запуск внутреннего сервера на Python:
$ wsb serve (можно включить в состав ссылки запуска браузера или автозагрузку... но зачем?...)
WIKI - https://github.com/danny0838/webscrapbook/wiki
Выполнение захватов страниц - https://github.com/danny0838/webscrapbook/wiki/Basic#capture-web-pages
Предварительные установка и базовая настройка внутреннего сервера
https://github.com/danny0838/webscrapbook/wiki/Basic
1) Установите пакеты Python (если не установлен) - https://packaging.python.org/en/latest/tutorials/installing-packages/#installing-from-local-archives
и Pip (это система управления пакетами, которая позволяет устанавливать пакеты Python из индекса пакетов Python (PyPI) и других репозиториев):
# apt install python3
# apt install python3-pip
(Основные команды использования PIP-а: $pip install <package> $pip uninstall <package> $pip list ...)
2) Установите PyWebScrapBook (если это сделать локально, не из под ROOT-а - придется прописывать пути переменных окружения Python для запуска команд пакета):
# python3 -m pip install -U webscrapbook (https://pypi.org/project/webscrapbook/)
3) Установите расширение браузера, затем в разделе его опций "Capture saving" установите опции "Save captured data to:" в состояние [Backend server], "Save captured data as:" - [Folder].
При необходимости - в разделе опций "Backend server" > "Address:" - http://localhost:8080/ (используется по умолчанию)...
4) https://pypi.org/project/webscrapbook/
- Создайте каталог для сохранения веб альбомов, ex: $mkdir /path/to/WebScrapBook
- Перейдите в него: $cd /path/to/WebScrapBook
- Сгенерируйте файлы конфигурации сервера для каталога: $wsb config -ba
(отредактируйте .wsb/config.ini в соответствии соответствии с потребностями - https://github.com/danny0838/webscrapbook/wiki/Backend, внимательнее к расположению каталогов data tree внутри альбомов)
- Запустите сгенерированный файл .wsb/serve.py, чтобы запустить сервер, или выполните следующую команду из CLI:
wsb serve (см. начало)
5) При необходимости создайте индекс сайта на внутреннем сервере (toolbar button > Options > Backend server - indexer > Run indexer) для клиентов без WebScrapBook, чтобы они могли просматривать захваченные страницы.
Конфигурирование Бэкенд-сервера - https://github.com/danny0838/webscrapbook/wiki/Backend
(В т.ч. размещение нескольких альбомов на внутреннем сервере)
--------------------------------------------------------------------------------
Scrapbook, созданные из устаревших ScrapBook или ScrapBook X , могут быть преобразованы в формат, совместимый с WebScrapBook - https://github.com/danny0838/webscrapbook/wiki/Diffs#compatibility
wsb convert sb2wsb /path/to/scrapbook /path/to/webscrapbook
Комментариев нет:
Отправить комментарий