Rebuild nozebra.pl: відмінності між версіями
Перейти до навігації
Перейти до пошуку
Dubyk (обговорення | внесок) (→Опис) |
Dubyk (обговорення | внесок) |
||
| (Не показано 9 проміжних версій цього користувача) | |||
| Рядок 7: | Рядок 7: | ||
Параметри: |
Параметри: |
||
'''-b''' |
|||
'''-b''' index bibliographic records |
|||
: — індексувати бібліографічні записи |
|||
'''-a''' |
|||
'''-a''' index authority records |
|||
: — індексувати авторитетні записи |
|||
''' -daemon''' |
|||
-daemon Run in daemon mode. The program will loop checking |
|||
: — Запуск у режимі сервісу. Програма циклічно перевіряє таблицю zebraqueue, обробляючи записи поступово, якщо вони є, після чого робить паузу на кілька секунд і повторює процес. |
|||
for entries on the zebraqueue table, processing |
|||
: Перевірка таблиці zebraqueue виконується простим SQL-запитом. Це дозволяє майже в реальному часі оновлювати пошуковий індекс Zebra з мінімальним навантаженням на систему. |
|||
them incrementally if present, and then sleep |
|||
: Використовуйте -sleep для керування інтервалом перевірки. |
|||
for a few seconds before repeating the process |
|||
: Режим сервісу передбачає параметри -z, -a, -b. Програма відмовиться запускатися, якщо вказані параметри, які не мають сенсу під час інкрементального оновлення (наприклад, -r чи -offset). |
|||
Checking the zebraqueue table is done with a cheap |
|||
SQL query. This allows for near realtime update of |
|||
the zebra search index with low system overhead. |
|||
Use -sleep to control the checking interval. |
|||
Daemon mode implies -z, -a, -b. The program will |
|||
refuse to start if options are present that do not |
|||
make sense while running as an incremental update |
|||
daemon (e.g. -r or -offset). |
|||
''' -sleep 10''' |
|||
-sleep 10 Seconds to sleep between checks of the zebraqueue |
|||
: — Кількість секунд паузи між перевірками таблиці zebraqueue у режимі сервісу. Типово — 5 секунд. |
|||
table in daemon mode. The default is 5 seconds. |
|||
''' -z''' |
|||
-z select only updated and deleted |
|||
: — Вибирати лише оновлені та вилученіі записи, позначені у таблиці zebraqueue. Неможливо використовувати разом із -r або -s. |
|||
records marked in the zebraqueue |
|||
table. Cannot be used with -r |
|||
or -s. |
|||
--skip-deletes |
''' --skip-deletes''' |
||
: — Вибирати лише оновлення записів, без вилучень, щоб уникнути надмірного I/O під час обробки вилучень zebraidx. |
|||
deletions, to avoid potential excessive |
|||
: Якщо цей параметр використовується для звичайної індексації, слід налаштувати cron-завдання для запуску |
|||
I/O when zebraidx processes deletions. |
|||
: rebuild_zebra.pl -z без --skip-deletes |
|||
: у неробочий час. |
|||
a cronjob should be set up to run |
|||
: Діє лише з -z. |
|||
rebuild_zebra.pl -z without --skip-deletes |
|||
during off hours. |
|||
Only effective with -z. |
|||
''' -r ''' |
|||
-r clear Zebra index before |
|||
: — Очистити індекс Zebra перед додаванням записів. Передбачає -w. |
|||
adding records to index. Implies -w. |
|||
''' -d ''' |
|||
-d Temporary directory for indexing. |
|||
: — Тимчасовий каталог для індексації. |
|||
If not specified, one is automatically |
|||
: Якщо не вказаний, створюється автоматично. Каталог експорту видаляється автоматично, якщо не задано параметр -k. |
|||
created. The export directory |
|||
is automatically deleted unless |
|||
you supply the -k switch. |
|||
''' -k''' |
|||
-k Do not delete export directory. |
|||
: — Не вилучати каталог експорту. |
|||
''' -s''' |
|||
-s Skip export. Used if you have |
|||
: — Пропустити експорт. Використовується, якщо записи вже були експортовані під час попереднього запуску. |
|||
already exported the records |
|||
in a previous run. |
|||
''' -nosanitize''' |
|||
-nosanitize export biblio/authority records directly from DB marcxml |
|||
: — Експортувати бібліографічні/авторитетні записи безпосередньо з поля marcxml у БД без „очищення“. Це пришвидшує процес дампу, але може спричинити помилки, якщо у БД є некоректно закодовані записи. Працює лише з -x. |
|||
field without sanitizing records. It speed up |
|||
dump process but could fail if DB contains badly |
|||
encoded records. Works only with -x, |
|||
''' -w''' |
|||
-w skip shadow indexing for this batch |
|||
: — Пропустити „тіньове індексування“ для цього пакета. |
|||
''' -y''' |
|||
-y do NOT clear zebraqueue after indexing; normally, |
|||
: — НЕ очищати zebraqueue після індексації; зазвичай після пакетної індексації zebraqueue має бути позначена як виконана для відповідних типів записів, щоб zebraqueue_daemon не намагався їх повторно індексувати. Використовуйте -y, щоб змінити це. |
|||
after doing batch indexing, zebraqueue should be |
|||
: Неможливо використовувати з -z. |
|||
marked done for the affected record type(s) so that |
|||
a running zebraqueue_daemon doesn't try to reindex |
|||
the same records - specify -y to override this. |
|||
Cannot be used with -z. |
|||
''' -v''' |
|||
-v increase the amount of logging. Normally only |
|||
: — Збільшити рівень логування. Типово показуються лише попередження та помилки індексації. |
|||
warnings and errors from the indexing are shown. |
|||
: Використовуйте рівень логування 2 (-v -v), щоб включити усі журнали Zebra. |
|||
Use log level 2 (-v -v) to include all Zebra logs. |
|||
--length 1234 |
''' --length 1234''' |
||
: — Кількість бібліографічних записів для експорту. |
|||
--offset 1243 offset you want to start to |
|||
example: --offset 500 --length=500 will result in a LIMIT 500,1000 (exporting 1000 records, starting by the 500th one |
|||
) |
|||
note that the numbers are NOT related to biblionumber, that's the intended behaviour. |
|||
--where let you specify a WHERE query, like itemtype='BOOK' |
|||
or something like that |
|||
''' --offset 1243''' |
|||
--run-as-root explicitily allow script to run as 'root' user |
|||
: — Зміщення, з якого почати експорт. |
|||
: приклад: --offset 500 --length=500 призведе до LIMIT 500,1000 (експорт 1000 записів, починаючи з 500-го). |
|||
: ) |
|||
: Зверніть увагу: ці числа НЕ пов’язані з biblionumber — так і задумано. |
|||
''' --where''' |
|||
--wait-for-lock when not running in daemon mode, the default |
|||
: — Дозволяє вказати умову WHERE, наприклад itemtype='BOOK' чи щось подібне. |
|||
behavior is to abort a rebuild if the rebuild |
|||
lock is busy. This option will cause the program |
|||
to wait for the lock to free and then continue |
|||
processing the rebuild request, |
|||
''' --run-as-root''' |
|||
--table specify a table (can be items, biblioitems, biblio, biblio_metadata) to retrieve biblionumber to index. |
|||
: — Явно дозволити запуск сценарію від користувача 'root'. |
|||
biblioitems is the default value. |
|||
''' --wait-for-lock''' |
|||
--help or -h show this message. |
|||
: — Якщо не в режимі служби, типовою поведінкою є переривання відновлення, якщо блокування зайняте. Цей параметр змусить програму чекати звільнення блокування і тоді продовжити процес. |
|||
''' --table''' |
|||
: — Вказати таблицю (може бути items, biblioitems, biblio, biblio_metadata) для отримання biblionumber для індексації. |
|||
: Типово використовується biblioitems. |
|||
''' --help or -h''' |
|||
: — Показати це повідомлення. |
|||
== Джерела == |
== Джерела == |
||
* https://git.koha-community.org/gitweb/?p=koha.git;a=blob;f=misc/migration_tools/rebuild_zebra.pl;h=ec19ce1f5c40445dcdb7c033414fde02dcb06c2b;hb=HEAD |
* https://git.koha-community.org/gitweb/?p=koha.git;a=blob;f=misc/migration_tools/rebuild_zebra.pl;h=ec19ce1f5c40445dcdb7c033414fde02dcb06c2b;hb=HEAD#l857 |
||
* https://github.com/Koha-Community/Koha/blob/master/misc/migration_tools/rebuild_zebra.pl |
* https://github.com/Koha-Community/Koha/blob/master/misc/migration_tools/rebuild_zebra.pl |
||
Поточна версія на 08:52, 29 вересня 2025
Назва
rebuild_nozebra.pl — сценарій переіндексування бібліографічних та віторитетних MARC-записів у БД Zebra.
Використовуйте це пакетне завдання, щоб переіндексувати усі бібліотечні або авторитетні записи у Вашій базі даних Koha.
Опис
Параметри:
-b
- — індексувати бібліографічні записи
-a
- — індексувати авторитетні записи
-daemon
- — Запуск у режимі сервісу. Програма циклічно перевіряє таблицю zebraqueue, обробляючи записи поступово, якщо вони є, після чого робить паузу на кілька секунд і повторює процес.
- Перевірка таблиці zebraqueue виконується простим SQL-запитом. Це дозволяє майже в реальному часі оновлювати пошуковий індекс Zebra з мінімальним навантаженням на систему.
- Використовуйте -sleep для керування інтервалом перевірки.
- Режим сервісу передбачає параметри -z, -a, -b. Програма відмовиться запускатися, якщо вказані параметри, які не мають сенсу під час інкрементального оновлення (наприклад, -r чи -offset).
-sleep 10
- — Кількість секунд паузи між перевірками таблиці zebraqueue у режимі сервісу. Типово — 5 секунд.
-z
- — Вибирати лише оновлені та вилученіі записи, позначені у таблиці zebraqueue. Неможливо використовувати разом із -r або -s.
--skip-deletes
- — Вибирати лише оновлення записів, без вилучень, щоб уникнути надмірного I/O під час обробки вилучень zebraidx.
- Якщо цей параметр використовується для звичайної індексації, слід налаштувати cron-завдання для запуску
- rebuild_zebra.pl -z без --skip-deletes
- у неробочий час.
- Діє лише з -z.
-r
- — Очистити індекс Zebra перед додаванням записів. Передбачає -w.
-d
- — Тимчасовий каталог для індексації.
- Якщо не вказаний, створюється автоматично. Каталог експорту видаляється автоматично, якщо не задано параметр -k.
-k
- — Не вилучати каталог експорту.
-s
- — Пропустити експорт. Використовується, якщо записи вже були експортовані під час попереднього запуску.
-nosanitize
- — Експортувати бібліографічні/авторитетні записи безпосередньо з поля marcxml у БД без „очищення“. Це пришвидшує процес дампу, але може спричинити помилки, якщо у БД є некоректно закодовані записи. Працює лише з -x.
-w
- — Пропустити „тіньове індексування“ для цього пакета.
-y
- — НЕ очищати zebraqueue після індексації; зазвичай після пакетної індексації zebraqueue має бути позначена як виконана для відповідних типів записів, щоб zebraqueue_daemon не намагався їх повторно індексувати. Використовуйте -y, щоб змінити це.
- Неможливо використовувати з -z.
-v
- — Збільшити рівень логування. Типово показуються лише попередження та помилки індексації.
- Використовуйте рівень логування 2 (-v -v), щоб включити усі журнали Zebra.
--length 1234
- — Кількість бібліографічних записів для експорту.
--offset 1243
- — Зміщення, з якого почати експорт.
- приклад: --offset 500 --length=500 призведе до LIMIT 500,1000 (експорт 1000 записів, починаючи з 500-го).
- )
- Зверніть увагу: ці числа НЕ пов’язані з biblionumber — так і задумано.
--where
- — Дозволяє вказати умову WHERE, наприклад itemtype='BOOK' чи щось подібне.
--run-as-root
- — Явно дозволити запуск сценарію від користувача 'root'.
--wait-for-lock
- — Якщо не в режимі служби, типовою поведінкою є переривання відновлення, якщо блокування зайняте. Цей параметр змусить програму чекати звільнення блокування і тоді продовжити процес.
--table
- — Вказати таблицю (може бути items, biblioitems, biblio, biblio_metadata) для отримання biblionumber для індексації.
- Типово використовується biblioitems.
--help or -h
- — Показати це повідомлення.