Nagios 与 Redis Enterprise
Redis Enterprise Software (RS) Nagios 插件使您能够监控 RS 相关对象和警报的状态。RS 警报可以与集群、节点或数据库相关。
Redis Enterprise Software (RS) Nagios 插件使您能够监控 RS 相关 对象和警报。RS 警报可以与集群、节点、 或数据库。
可通过 Nagios 监控的警报与可以监控的警报相同 在 RS UI 的 Settings > Alerts 页面中配置,或者 特定的 Database > Configuration 页面。
所有警报配置(活动/非活动、设置阈值等) 只能通过 RS UI 完成,不能在 Nagios 中进行设置。 通过 Nagios,您只能查看 警报。
警报的完整列表可以在插件包本身中找到(在 “/rlec_obj/rlec_services.cfg” 文件,更多详细信息见下文)。
RS Nagios 插件支持从 Gnome 密钥环中检索 API 密码, KWallet、Windows 凭据库、Mac OS X 钥匙串(如果存在)或 否则为 Linux Secret Service 兼容的密码存储。没有 密钥环服务可用,密码以 base64 编码保存, 在用户主目录下。
配置 Nagios 插件
为了配置 Nagios 插件,您需要复制 将软件包放入您的 Nagios 环境中,并将它们放在 Nagios 配置目录。或者,您也可以复制 将软件包配置添加到您现有的 Nagios 配置中。
如果需要 Keyring 功能来存储密码,则 python keyring 应按照以下步骤安装和使用软件包 Nagios 计算机上的作系统 CLI:
- pip install keyring 安装软件包(有关如何安装 Python 的信息,请参阅 https://pip.pypa.io/en/stable/installing/ pip (如果需要)。
- keyring set RS-Nagios <RS user email> 设置密码。 用户电子邮件应与 Nagios 中使用的电子邮件相同 配置和密码应使用相同的用户设置 运行 Nagios 服务器。
然后,您需要更新本地参数,例如主机名、 addresses 和对象 ID 转换为与您的 RS 部署。
最后,您需要为每个节点和数据库设置配置 您想要监控。更多详情如下。
RS Nagios 软件包包括两个组件:
- 插件本身 - 后缀为 “rlec_nagios_plugin”
- 配置文件 - 后缀为 “rlec_nagios_conf”
以下是这些软件包和说明中包含的文件列表 关于需要对这些苍蝇进行哪些更新。
注意:以下说明假设您在 Ubuntu 上运行,并且具有 clean Nagios 安装,并且 Nagios 的基本目录是 “/usr/local/nagios/”
第 1 步
从插件文件夹及其内容中复制名为 “libexec” 的文件夹 到 “/usr/local/nagios/”
其中包含的文件包括:
- check_rlec_alert
- check_rlec_node
- check_rlec_bdb
- email_stub
- rlecdigest.py
注 : check_rlec_alert、check_rlec_node check_rlec_bdb 文件 是实际的插件实现。您可以使用 “h” 开关来检索他们的文档和他们期望的 参数。
步骤 2
将以下几行加入你的 “nagios.cfg” 内:
- cfg_dir=/usr/local/nagios/etc/rlec_obj
- cfg_dir=/usr/local/nagios/etc/rlec_local
- resource_file=/usr/local/nagios/etc/rlec_resource.cfg
步骤 3
将配置文件及其文件夹复制到 “/usr/local/nagios/etc” 并进行所需的更新,详情如下 下面。
- 在“/etc”文件夹下:
- “rlec_resource.cfg ”包含全局变量定义 用于连接到 RS 的用户和密码。您应该更新 变量添加到您的 部署。
- “rlec_local ”文件夹
- “rlec_obj” 文件夹
- 在“/rlec_local”文件夹下:
- “cluster.cfg” 保存集群中的配置详细信息
水平。如果要监控多个集群,则
您需要复制文件中的两个现有条目
每个集群。
- 第一个 “define host” 部分为
其他
配置文件。
- 将集群名称 (FQDN) 的 “address” 更新为 在 DNS 中定义,或者 集群。
- 如果要配置多个 RS,则当
复制此部分时,应确保:
- “name” 是唯一的。
- 在第二个 “define host” 部分中:
- 每个条目中的“host_name ”必须是唯一的。
- 每个条目中的“display_name”可以更新为 用户友好的名称,显示在 Nagios UI 中。
- 第一个 “define host” 部分为
其他
配置文件。
- “contacts.cfg” 包含配置详细信息 谁发送电子邮件 自。它应更新为与您的部署相关的值。 如果此文件已存在于您现有的 Nagios 环境中 然后你应该相应地更新它。
- “databases.cfg” 保存数据库的配置详细信息
进行监控。应复制 “define host” 部分
每个数据库都要监控。
- “host_name” 应为唯一值。
- “display_name ”应更新为用户友好的名称 以在 UI 中显示。
- “_RLECID ”应该是数据库的内部 ID,可以
检索自
rladmin status
命令输出。
- “nodes.cfg ”保存
簇。应复制 “define host” 部分
集群中的每个节点。
- “host_name” 应为唯一值。
- “display_name ”应更新为用户友好的名称 以在 UI 中显示。
- “address” 应更新为映射到 节点的 IP 地址,或 IP 地址本身。
- “_RLECID ” 应该是节点的内部 ID,可以是
检索
从
rladmin status
命令输出。
- 在“/rlec_obj”文件夹下:
- “rlec_cmd.cfg” 包含有关如何 激活插件。无需对其进行任何更新。
- “rlec_groups.cfg” 包含主机组的定义。无需 以对其进行任何更新。
- “rlec_services.cfg” 包含所有警报的定义,这些警报 受到监控。无需对其进行任何更新。
- “rlec_templates.cfg” 包含一般的 RS Nagios 定义。 无需对其进行任何更新。
- “cluster.cfg” 保存集群中的配置详细信息
水平。如果要监控多个集群,则
您需要复制文件中的两个现有条目
每个集群。