2022-05-04

WebScrapBook - каталог альбомов веб-страниц для просмотра офлайн

 WebScrapBook — расширение браузера, позволяющее сохранять веб-страницы для просмотра офлайн в виде древовидной базы данных.

        https://github.com/danny0838/webscrapbook

Это расширение доступно для браузеров на базе Chromium и Firefox и может быть установлено из соответствующего интернет-магазина.

Для функционирования WebScrapBook в Боковой панели браузера в режиме WYSIWYG (доступ через toolbar button > Open scrapbook), необходим предварительный запуск внутреннего сервера на Python:

        $ wsb serve    (можно включить в состав ссылки запуска браузера или автозагрузку... но зачем?...)


 WIKIhttps://github.com/danny0838/webscrapbook/wiki

Выполнение захватов страниц - https://github.com/danny0838/webscrapbook/wiki/Basic#capture-web-pages


Предварительные установка и базовая настройка внутреннего сервера

 https://github.com/danny0838/webscrapbook/wiki/Basic


1) Установите пакеты Python (если не установлен) - https://packaging.python.org/en/latest/tutorials/installing-packages/#installing-from-local-archives

и Pip (это система управления пакетами, которая позволяет устанавливать пакеты Python из индекса пакетов Python (PyPI) и других репозиториев):

      # apt install python3

        # apt install python3-pip

(Основные команды использования PIP-а: $pip install <package>  $pip uninstall <package> $pip list ...)


2) Установите PyWebScrapBook (если это сделать локально, не из под ROOT-а - придется прописывать пути переменных окружения Python для запуска команд пакета):

        # python3 -m pip install -U webscrapbook (https://pypi.org/project/webscrapbook/)


3) Установите расширение браузера, затем в разделе его опций "Capture saving" установите опции "Save captured data to:" в состояние [Backend server], "Save captured data as:" - [Folder].

        При необходимости - в разделе опций "Backend server" > "Address:" - http://localhost:8080/ (используется по умолчанию)... 


4) https://pypi.org/project/webscrapbook/

   - Создайте каталог для сохранения веб альбомов, ex: $mkdir /path/to/WebScrapBook

   - Перейдите в него: $cd /path/to/WebScrapBook

   - Сгенерируйте файлы конфигурации сервера для каталога: $wsb config -ba

        (отредактируйте .wsb/config.ini в соответствии соответствии с потребностями - https://github.com/danny0838/webscrapbook/wiki/Backend, внимательнее к расположению каталогов data tree внутри альбомов)

   - Запустите сгенерированный файл .wsb/serve.py, чтобы запустить сервер, или выполните следующую команду из CLI:

        wsb serve  (см. начало)


5) При необходимости создайте индекс сайта на внутреннем сервере (toolbar button > Options > Backend server - indexer > Run indexer) для клиентов без WebScrapBook, чтобы они могли просматривать захваченные страницы.


Конфигурирование Бэкенд-сервера - https://github.com/danny0838/webscrapbook/wiki/Backend
(В т.ч. размещение нескольких альбомов на внутреннем сервере)

--------------------------------------------------------------------------------


Scrapbook, созданные из устаревших ScrapBook или ScrapBook X , могут быть преобразованы в формат, совместимый с WebScrapBook - https://github.com/danny0838/webscrapbook/wiki/Diffs#compatibility

        wsb convert sb2wsb /path/to/scrapbook /path/to/webscrapbook


Комментариев нет:

Отправить комментарий