Rebuild nozebra.pl: відмінності між версіями

Матеріал з Koha Ukraine Wiki
Перейти до навігації Перейти до пошуку
 
(Не показані 2 проміжні версії цього користувача)
Рядок 8: Рядок 8:


'''-b'''
'''-b'''
: — індексувати бібліографічні записи
: — index bibliographic records


'''-a'''
'''-a'''
: — індексувати авторитетні записи
: — index authority records


''' -daemon'''
''' -daemon'''
: — Запуск у режимі сервісу. Програма циклічно перевіряє таблицю zebraqueue, обробляючи записи поступово, якщо вони є, після чого робить паузу на кілька секунд і повторює процес.
: — Run in daemon mode. The program will loop checking
: Перевірка таблиці zebraqueue виконується простим SQL-запитом. Це дозволяє майже в реальному часі оновлювати пошуковий індекс Zebra з мінімальним навантаженням на систему.
: for entries on the zebraqueue table, processing
: Використовуйте -sleep для керування інтервалом перевірки.
: them incrementally if present, and then sleep
: Режим сервісу передбачає параметри -z, -a, -b. Програма відмовиться запускатися, якщо вказані параметри, які не мають сенсу під час інкрементального оновлення (наприклад, -r чи -offset).
: for a few seconds before repeating the process
: Checking the zebraqueue table is done with a cheap
: SQL query. This allows for near realtime update of
: the zebra search index with low system overhead.
: Use -sleep to control the checking interval.


: Daemon mode implies -z, -a, -b. The program will
: refuse to start if options are present that do not
: make sense while running as an incremental update
: daemon (e.g. -r or -offset).


''' -sleep 10'''
''' -sleep 10'''
: — Кількість секунд паузи між перевірками таблиці zebraqueue у режимі сервісу. Типово — 5 секунд.
: — Seconds to sleep between checks of the zebraqueue
: table in daemon mode. The default is 5 seconds.


''' -z'''
''' -z'''
: — Вибирати лише оновлені та вилученіі записи, позначені у таблиці zebraqueue. Неможливо використовувати разом із -r або -s.
: — select only updated and deleted
: records marked in the zebraqueue
: table. Cannot be used with -r
: or -s.


''' --skip-deletes'''
''' --skip-deletes'''
: — Вибирати лише оновлення записів, без вилучень, щоб уникнути надмірного I/O під час обробки вилучень zebraidx.
: — only select record updates, not record
: Якщо цей параметр використовується для звичайної індексації, слід налаштувати cron-завдання для запуску
: deletions, to avoid potential excessive
: I/O when zebraidx processes deletions.
: rebuild_zebra.pl -z без --skip-deletes
: у неробочий час.
: If this option is used for normal indexing,
: Діє лише з -z.
: a cronjob should be set up to run
: rebuild_zebra.pl -z without --skip-deletes
: during off hours.
: Only effective with -z.


''' -r '''
''' -r '''
: — Очистити індекс Zebra перед додаванням записів. Передбачає -w.
: — clear Zebra index before
: adding records to index. Implies -w.


''' -d '''
''' -d '''
: — Тимчасовий каталог для індексації.
: — Temporary directory for indexing.
: Якщо не вказаний, створюється автоматично. Каталог експорту видаляється автоматично, якщо не задано параметр -k.
: If not specified, one is automatically
: created. The export directory
: is automatically deleted unless
: you supply the -k switch.


''' -k'''
''' -k'''
: — Не вилучати каталог експорту.
: — Do not delete export directory.


''' -s'''
''' -s'''
: — Пропустити експорт. Використовується, якщо записи вже були експортовані під час попереднього запуску.
: — Skip export. Used if you have
: already exported the records
: in a previous run.


''' -nosanitize'''
''' -nosanitize'''
: — Експортувати бібліографічні/авторитетні записи безпосередньо з поля marcxml у БД без „очищення“. Це пришвидшує процес дампу, але може спричинити помилки, якщо у БД є некоректно закодовані записи. Працює лише з -x.
: — export biblio/authority records directly from DB marcxml
: field without sanitizing records. It speed up
: dump process but could fail if DB contains badly
: encoded records. Works only with -x,


''' -w'''
''' -w'''
: — Пропустити „тіньове індексування“ для цього пакета.
: — skip shadow indexing for this batch


''' -y'''
''' -y'''
: — НЕ очищати zebraqueue після індексації; зазвичай після пакетної індексації zebraqueue має бути позначена як виконана для відповідних типів записів, щоб zebraqueue_daemon не намагався їх повторно індексувати. Використовуйте -y, щоб змінити це.
: — do NOT clear zebraqueue after indexing; normally,
: Неможливо використовувати з -z.
: after doing batch indexing, zebraqueue should be
: marked done for the affected record type(s) so that
: a running zebraqueue_daemon doesn't try to reindex
: the same records - specify -y to override this.
: Cannot be used with -z.


''' -v'''
''' -v'''
: — Збільшити рівень логування. Типово показуються лише попередження та помилки індексації.
: — increase the amount of logging. Normally only
: Використовуйте рівень логування 2 (-v -v), щоб включити усі журнали Zebra.
: warnings and errors from the indexing are shown.
: Use log level 2 (-v -v) to include all Zebra logs.


''' --length 1234'''
''' --length 1234'''
: — Кількість бібліографічних записів для експорту.
: — how many biblio you want to export


''' --offset 1243'''
''' --offset 1243'''
: — Зміщення, з якого почати експорт.
: — offset you want to start to
: example: --offset 500 --length=500 will result in a LIMIT 500,1000 (exporting 1000 records, starting by the 500th one
: приклад: --offset 500 --length=500 призведе до LIMIT 500,1000 (експорт 1000 записів, починаючи з 500-го).
: )
: )
: Зверніть увагу: ці числа НЕ пов’язані з biblionumber — так і задумано.
: note that the numbers are NOT related to biblionumber, that's the intended behaviour.


''' --where'''
''' --where'''
: — let you specify a WHERE query, like itemtype='BOOK'
: — Дозволяє вказати умову WHERE, наприклад itemtype='BOOK' чи щось подібне.
: or something like that


''' --run-as-root'''
''' --run-as-root'''
: — Явно дозволити запуск сценарію від користувача 'root'.
: — explicitily allow script to run as 'root' user


''' --wait-for-lock'''
''' --wait-for-lock'''
: — Якщо не в режимі служби, типовою поведінкою є переривання відновлення, якщо блокування зайняте. Цей параметр змусить програму чекати звільнення блокування і тоді продовжити процес.
: — when not running in daemon mode, the default
: behavior is to abort a rebuild if the rebuild
: lock is busy. This option will cause the program
: to wait for the lock to free and then continue
: processing the rebuild request,


''' --table'''
''' --table'''
: — specify a table (can be items, biblioitems, biblio, biblio_metadata) to retrieve biblionumber to index.
: — Вказати таблицю (може бути items, biblioitems, biblio, biblio_metadata) для отримання biblionumber для індексації.
: Типово використовується biblioitems.
: biblioitems is the default value.


''' --help or -h'''
''' --help or -h'''
: — Показати це повідомлення.
: — show this message.


== Джерела ==
== Джерела ==
* https://git.koha-community.org/gitweb/?p=koha.git;a=blob;f=misc/migration_tools/rebuild_zebra.pl;h=ec19ce1f5c40445dcdb7c033414fde02dcb06c2b;hb=HEAD
* https://git.koha-community.org/gitweb/?p=koha.git;a=blob;f=misc/migration_tools/rebuild_zebra.pl;h=ec19ce1f5c40445dcdb7c033414fde02dcb06c2b;hb=HEAD#l857
* https://github.com/Koha-Community/Koha/blob/master/misc/migration_tools/rebuild_zebra.pl
* https://github.com/Koha-Community/Koha/blob/master/misc/migration_tools/rebuild_zebra.pl

Поточна версія на 08:52, 29 вересня 2025

Назва

rebuild_nozebra.pl — сценарій переіндексування бібліографічних та віторитетних MARC-записів у БД Zebra.

Використовуйте це пакетне завдання, щоб переіндексувати усі бібліотечні або авторитетні записи у Вашій базі даних Koha.

Опис

Параметри:

-b

— індексувати бібліографічні записи

-a

— індексувати авторитетні записи

-daemon

— Запуск у режимі сервісу. Програма циклічно перевіряє таблицю zebraqueue, обробляючи записи поступово, якщо вони є, після чого робить паузу на кілька секунд і повторює процес.
Перевірка таблиці zebraqueue виконується простим SQL-запитом. Це дозволяє майже в реальному часі оновлювати пошуковий індекс Zebra з мінімальним навантаженням на систему.
Використовуйте -sleep для керування інтервалом перевірки.
Режим сервісу передбачає параметри -z, -a, -b. Програма відмовиться запускатися, якщо вказані параметри, які не мають сенсу під час інкрементального оновлення (наприклад, -r чи -offset).


-sleep 10

— Кількість секунд паузи між перевірками таблиці zebraqueue у режимі сервісу. Типово — 5 секунд.

-z

— Вибирати лише оновлені та вилученіі записи, позначені у таблиці zebraqueue. Неможливо використовувати разом із -r або -s.

--skip-deletes

— Вибирати лише оновлення записів, без вилучень, щоб уникнути надмірного I/O під час обробки вилучень zebraidx.
Якщо цей параметр використовується для звичайної індексації, слід налаштувати cron-завдання для запуску
rebuild_zebra.pl -z без --skip-deletes
у неробочий час.
Діє лише з -z.

-r

— Очистити індекс Zebra перед додаванням записів. Передбачає -w.

-d

— Тимчасовий каталог для індексації.
Якщо не вказаний, створюється автоматично. Каталог експорту видаляється автоматично, якщо не задано параметр -k.

-k

— Не вилучати каталог експорту.

-s

— Пропустити експорт. Використовується, якщо записи вже були експортовані під час попереднього запуску.

-nosanitize

— Експортувати бібліографічні/авторитетні записи безпосередньо з поля marcxml у БД без „очищення“. Це пришвидшує процес дампу, але може спричинити помилки, якщо у БД є некоректно закодовані записи. Працює лише з -x.

-w

— Пропустити „тіньове індексування“ для цього пакета.

-y

— НЕ очищати zebraqueue після індексації; зазвичай після пакетної індексації zebraqueue має бути позначена як виконана для відповідних типів записів, щоб zebraqueue_daemon не намагався їх повторно індексувати. Використовуйте -y, щоб змінити це.
Неможливо використовувати з -z.

-v

— Збільшити рівень логування. Типово показуються лише попередження та помилки індексації.
Використовуйте рівень логування 2 (-v -v), щоб включити усі журнали Zebra.

--length 1234

— Кількість бібліографічних записів для експорту.

--offset 1243

— Зміщення, з якого почати експорт.
приклад: --offset 500 --length=500 призведе до LIMIT 500,1000 (експорт 1000 записів, починаючи з 500-го).
)
Зверніть увагу: ці числа НЕ пов’язані з biblionumber — так і задумано.

--where

— Дозволяє вказати умову WHERE, наприклад itemtype='BOOK' чи щось подібне.

--run-as-root

— Явно дозволити запуск сценарію від користувача 'root'.

--wait-for-lock

— Якщо не в режимі служби, типовою поведінкою є переривання відновлення, якщо блокування зайняте. Цей параметр змусить програму чекати звільнення блокування і тоді продовжити процес.

--table

— Вказати таблицю (може бути items, biblioitems, biblio, biblio_metadata) для отримання biblionumber для індексації.
Типово використовується biblioitems.

--help or -h

— Показати це повідомлення.

Джерела