| 网管联盟 | 网管论坛 | 网管u家 | 网管博客 | 网管软件 | 网管求职 | 小游戏 | 网管搜索 | 网管原创 | 网管聚合 | 网管读摘 | 网管焦点 | 世界素材 | 会员投稿 | 会员中心 |
![]() |
| Windows Linux Cisco 网络技术 数据库 黑客攻防 DotNet Java PHP 认证 新闻资讯 服务器 存储资讯 网络设备 网管学堂 技术专题 焦点 网吧频道 |
1. 定义所获得的“生产”资源的含义 - 一个服务器,一个应用或一种服务。
网管u家u.bitsCN.com
2. 找出满足此生产需求的监测方式。
3. 执行监测可能性,可以通过手动方式也可以借助开源工具,比如Nagios或其它商业工具。
4. 定义那些 “损坏、不存在、警惕” (broken/unavailable/on fire) 的含义 - 通常也被称之为 警告、出错、危险 (warn/error/critical)。 网管u家u.bitscn@com
5. 在你的监测系统中执行警报以捕捉这些阈值。
网管下载dl.bitscn.com
6. 定义不同的警报级别所对应的处理流程。
网管论坛bbs_bitsCN_com
7. 确保你的警报处理流程是与那些提示处理流程相符的。
网管下载dl.bitscn.com
8. 为各团队创建角色和责任来分摊与他们工作特性相符的警报、控制和细节操作。聚焦于个人通常意味着为他们的区域提供更好的绩效。 网管网www.bitscn.com
9. 为你整个系统中的警报、监测协议、角色等指定少数超级用户,以确保他们按照单一蓝本(blueprint)执行。 网管论坛bbs_bitsCN_com
10. 如需要,则进行修正、清理和重复。
|
0
|
评论加载中…