跳转到帖子

游客您好,欢迎来到黑客世界论坛!您可以在这里进行注册。

赤队小组-代号1949(原CHT攻防小组)在这个瞬息万变的网络时代,我们保持初心,创造最好的社区来共同交流网络技术。您可以在论坛获取黑客攻防技巧与知识,您也可以加入我们的Telegram交流群 共同实时探讨交流。论坛禁止各种广告,请注册用户查看我们的使用与隐私策略,谢谢您的配合。小组成员可以获取论坛隐藏内容!

TheHackerWorld官方

超好用的服务器监控&告警,快来试试

精选回复

发布于

# 超级好用的服务器监控报警

### 新功能

* 内置CPU内存,实时监控报警规则

* 自定义定期执行的脚本来监控和报警

### 使用场景

* 监控主机CPU和内存使用是否正常(例如均低于80%)

* 服务器正在挖矿,CPU占用率过高,导致业务服务不可用,并**保存报警时的进程列表**,方便后续排查。

* 服务器内存使用过高,导致业务服务OOM,保存当时的进程列表

* (Brick) 自定义脚本监控NAS磁盘是否正常

* 自建NASraid磁盘健康检查,如有损坏,及时备份数据,避免更大损失

*(银宇)发挥你的想象力,写出任意的监控脚本

### 教程

**需求一:监控主机CPU使用率是否异常,异常报警后找出哪个进程占用CPU这么高**

1.点击右上角设置,然后点击监控报警,进入配置页面51d7130afe37bdd03de2cc5f892fd6fe.png

2. 单击“添加监控项”,配置CPU或内存监控。

这里配置一条“CPU超过80%持续60秒”的报警规则2edd916372179bed4024d5f0192fe00e.png

选择需要监控的主机(一条监控规则可以批量选择多台主机) aefdbbcbb0cf7f230cb41fdab761f4d6.png

完成! (文末附测试计划和报警截图)a35ad1182b7e53a34e66fe509a3a1a40.png

简单验证报警是否正常:

* 通过压力测试CPU d254d440da8151c84916ed07604707e3.png

* 等待60秒(也可以在报警规则中配置更短的持续时间),已在消息列表中找到报警ed19e5f894cc2b1f620f9f362dbe39ff.png

* 点击详情查看触发警报的“恶意进程”快照1cc6b8bb10f5b2a6913b8231aa3a9ffe.png

* 如果您配置了微信公众号和钉钉机器人,还可以收到实时提醒509fbe042e899d6aa063383c394d8120.png

7d3ac7d6e40de309f77de0cc7533b157.png

**要求2:监控我的NAS磁盘是否有异常(毕竟有多年的学习资料)**

这是通过配置自定义脚本来实现的。如果脚本执行失败,就会产生警报(如果不包含healthy,则会产生警报)。

PS:这里的报警条件也可以选择“脚本输出包含关键字则报警”5d9ad91db98626be8110fbf2b7e9595c.png

8d9c005afdd068c3dfd321e23974ff92.png

这里就不模拟演示了QAQ

### 总结

易于使用! 【快来试试吧】(https://rivers.chaitin.cn/?share=0a7c0e9b69a211ee9c6e0242c0a81709)

创建帐户或登录后发表意见

最近浏览 0

  • 没有会员查看此页面。