Rebuild nozebra.pl

Матеріал з Koha Ukraine Wiki
Версія від 08:52, 29 вересня 2025, створена Dubyk (обговорення | внесок) (→‎Джерела)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Назва

rebuild_nozebra.pl — сценарій переіндексування бібліографічних та віторитетних MARC-записів у БД Zebra.

Використовуйте це пакетне завдання, щоб переіндексувати усі бібліотечні або авторитетні записи у Вашій базі даних Koha.

Опис

Параметри:

-b

— індексувати бібліографічні записи

-a

— індексувати авторитетні записи

-daemon

— Запуск у режимі сервісу. Програма циклічно перевіряє таблицю zebraqueue, обробляючи записи поступово, якщо вони є, після чого робить паузу на кілька секунд і повторює процес.
Перевірка таблиці zebraqueue виконується простим SQL-запитом. Це дозволяє майже в реальному часі оновлювати пошуковий індекс Zebra з мінімальним навантаженням на систему.
Використовуйте -sleep для керування інтервалом перевірки.
Режим сервісу передбачає параметри -z, -a, -b. Програма відмовиться запускатися, якщо вказані параметри, які не мають сенсу під час інкрементального оновлення (наприклад, -r чи -offset).


-sleep 10

— Кількість секунд паузи між перевірками таблиці zebraqueue у режимі сервісу. Типово — 5 секунд.

-z

— Вибирати лише оновлені та вилученіі записи, позначені у таблиці zebraqueue. Неможливо використовувати разом із -r або -s.

--skip-deletes

— Вибирати лише оновлення записів, без вилучень, щоб уникнути надмірного I/O під час обробки вилучень zebraidx.
Якщо цей параметр використовується для звичайної індексації, слід налаштувати cron-завдання для запуску
rebuild_zebra.pl -z без --skip-deletes
у неробочий час.
Діє лише з -z.

-r

— Очистити індекс Zebra перед додаванням записів. Передбачає -w.

-d

— Тимчасовий каталог для індексації.
Якщо не вказаний, створюється автоматично. Каталог експорту видаляється автоматично, якщо не задано параметр -k.

-k

— Не вилучати каталог експорту.

-s

— Пропустити експорт. Використовується, якщо записи вже були експортовані під час попереднього запуску.

-nosanitize

— Експортувати бібліографічні/авторитетні записи безпосередньо з поля marcxml у БД без „очищення“. Це пришвидшує процес дампу, але може спричинити помилки, якщо у БД є некоректно закодовані записи. Працює лише з -x.

-w

— Пропустити „тіньове індексування“ для цього пакета.

-y

— НЕ очищати zebraqueue після індексації; зазвичай після пакетної індексації zebraqueue має бути позначена як виконана для відповідних типів записів, щоб zebraqueue_daemon не намагався їх повторно індексувати. Використовуйте -y, щоб змінити це.
Неможливо використовувати з -z.

-v

— Збільшити рівень логування. Типово показуються лише попередження та помилки індексації.
Використовуйте рівень логування 2 (-v -v), щоб включити усі журнали Zebra.

--length 1234

— Кількість бібліографічних записів для експорту.

--offset 1243

— Зміщення, з якого почати експорт.
приклад: --offset 500 --length=500 призведе до LIMIT 500,1000 (експорт 1000 записів, починаючи з 500-го).
)
Зверніть увагу: ці числа НЕ пов’язані з biblionumber — так і задумано.

--where

— Дозволяє вказати умову WHERE, наприклад itemtype='BOOK' чи щось подібне.

--run-as-root

— Явно дозволити запуск сценарію від користувача 'root'.

--wait-for-lock

— Якщо не в режимі служби, типовою поведінкою є переривання відновлення, якщо блокування зайняте. Цей параметр змусить програму чекати звільнення блокування і тоді продовжити процес.

--table

— Вказати таблицю (може бути items, biblioitems, biblio, biblio_metadata) для отримання biblionumber для індексації.
Типово використовується biblioitems.

--help or -h

— Показати це повідомлення.

Джерела