system.replicas
Содержит информацию и статус для реплицируемых таблиц, расположенных на локальном сервере. Эту таблицу можно использовать для мониторинга. Таблица содержит по строчке для каждой Replicated*-таблицы.
Пример:
Столбцы:
database
(String
) - имя БД.table
(String
) - имя таблицы.engine
(String
) - имя движка таблицы.is_leader
(UInt8
) - является ли реплика лидером. Несколько реплик могут быть лидерами одновременно. Реплике можно запретить быть лидером с помощьюmerge_tree
настройкиreplicated_can_become_leader
. Лидеры назначают фоновые слияния, которые следует произвести. Замечу, что запись можно осуществлять на любую реплику (доступную и имеющую сессию в ZK), независимо от лидерства.can_become_leader
(UInt8
) - может ли реплика быть лидером.is_readonly
(UInt8
) - находится ли реплика в режиме «только для чтения» Этот режим включается, если в конфиге нет секции с ZK; если при переинициализации сессии в ZK произошла неизвестная ошибка; во время переинициализации сессии с ZK.is_session_expired
(UInt8
) - истекла ли сессия с ZK. В основном, то же самое, что иis_readonly
.future_parts
(UInt32
) - количество кусков с данными, которые появятся в результате INSERT-ов или слияний, которых ещё предстоит сделатьparts_to_check
(UInt32
) - количество кусков с данными в очереди на проверку. Кусок помещается в очередь на проверку, если есть подозрение, что он может быть битым.zookeeper_path
(String
) - путь к данным таблицы в ZK.replica_name
(String
) - имя реплики в ZK; разные реплики одной таблицы имеют разное имя.replica_path
(String
) - путь к данным реплики в ZK. То же самое, что конкатенация zookeeper_path/replicas/replica_path.columns_version
(Int32
) - номер версии структуры таблицы. Обозначает, сколько раз был сделан ALTER. Если на репликах разные версии, значит некоторые реплики сделали ещё не все ALTER-ы.queue_size
(UInt32
) - размер очереди действий, которые предстоит сделать. К действиям относятся вставки блоков данных, слияния, и некоторые другие действия. Как правило, совпадает с future_parts.inserts_in_queue
(UInt32
) - количество вставок блоков данных, которые предстоит сделать. Обычно вставки должны быстро реплицироваться. Если величина большая - значит что-то не так.merges_in_queue
(UInt32
) - количество слияний, которые предстоит сделать. Бывают длинные слияния - то есть, это значение может быть больше нуля продолжительное время.part_mutations_in_queue
(UInt32
) - количество мутаций, которые предстоит сделать.queue_oldest_time
(DateTime
) - еслиqueue_size
больше 0, показывает, когда была добавлена в очередь самая старая операция.inserts_oldest_time
(DateTime
) - см.queue_oldest_time
.merges_oldest_time
(DateTime
) - см.queue_oldest_time
.part_mutations_oldest_time
(DateTime
) - см.queue_oldest_time
.
Следующие 4 столбца имеют ненулевое значение только если активна сессия с ZK.
log_max_index
(UInt64
) - максимальный номер записи в общем логе действий.log_pointer
(UInt64
) - максимальный номер записи из общего лога действий, которую реплика скопировала в свою очередь для выполнения, плюс единица. Если log_pointer сильно меньше log_max_index, значит что-то не так.last_queue_update
(DateTime
) - время последнего обновления запроса.absolute_delay
(UInt64
) - задержка (в секундах) для текущей реплики.total_replicas
(UInt8
) - общее число известных реплик этой таблицы.active_replicas
(UInt8
) - число реплик этой таблицы, имеющих сессию в ZK; то есть, число работающих реплик.last_queue_update_exception
(String
) - если в очереди есть битые записи. Особенно важно, когда в ClickHouse нарушается обратная совместимость между версиями, а записи журнала, сделанные более новыми версиями, не могут быть проанализированы старыми версиями.zookeeper_exception
(String
) - последнее сообщение об исключении. Появляется, если ошибка произошла при получении информации из ZooKeeper.replica_is_active
(Map(String, UInt8)) — соответствие между именем реплики и признаком активности реплики.
Если запрашивать все столбцы, то таблица может работать слегка медленно, так как на каждую строчку делается несколько чтений из ZK. Если не запрашивать последние 4 столбца (log_max_index, log_pointer, total_replicas, active_replicas), то таблица работает быстро.
Например, так можно проверить, что всё хорошо:
Если этот запрос ничего не возвращает - значит всё хорошо.