我们都知道天下没有“永不宕机”的真不错系统,但每次线上出问题都要拉出一个程序员“祭天”
。款k控系所以一款靠谱、产监好用的真不错监控工具就显得十分重要,它可以在生产环境出故障的款k控系第一时间发出告警,并提供详实的产监数据
,帮助程序员尽早发现故障
、真不错尽快定位问题。款k控系 可以毫不夸张地说
,产监监控就是真不错运维的眼睛、研发的免费模板款k控系“免死金牌”
,程序员“明哲保身、产监自证清白”的真不错必备利器
! 今天 HelloGitHub 给大家带来的产监是一款开箱即用、默认中文、界面美观的开源监控系统——夜莺监控(Nightingale),100% 国产更懂你的苦。你还在为搭建/配置/调优「Prometheus + AlertManager + Grafana」的监控平台而烦恼吗?开箱即用的夜莺监控轻松解决你的源码库问题。 GitHub:https://github.com/ccfos/nightingale 夜莺监控是一款先进的开源云原生监控分析系统 ,采用 All-In-One 的设计,集数据采集 、可视化
、监控告警、数据分析 、权限管理于一体,拥有企业级的监控分析和告警能力
。 夜莺监控在运维圈里很有名 ,它“出身名门”最初是由滴滴孵化并开源 ,模板下载在此期间沉淀了一线互联网公司可观测性的最佳实践,有大厂的实践背书可靠性和实用性上毋庸置疑。之后则捐赠给了中国计算机学会(CCF)进行托管,由运维圈的“老炮”秦晓辉等人设计
、开发和维护。截止到发文前,夜莺监控已在 GitHub 上获得了 7200+ 个 Star
、1200+ 次 Fork,发展势头迅猛、开源社区活跃,并且已经服务了上千家分布在各行各业的企业。 接下来,高防服务器就和 HelloGitHub 一起上手这款开箱即用的开源监控利器吧! 最简单的部署方式是使用 docker-compose,可实现一键启动,执行下面的命令即可: 启动之后浏览器直接访问:127.0.0.1:17000,输入账号 root 密码
:root.2020 ,登陆后就能看到管理界面啦
! 不过 ,我还是更推荐大家使用二进制方式部署
,因为这种方式不依赖 Docker
、更稳定、服务器租用升级也方便 ,可用于生产环境(官方推荐),部署起来也不麻烦,也就多几行命令的事 。下面是 linux x86 环境的示例和注解: 至此
,安装部分就结束了
,接下来就是上手体验了 。 夜莺不生产日志,只是日志的“监工”。所以安装完第一件事就是配置日志数据,用法类似 Grafana 可直接接入数据源,菜单位置
:「系统配置」-「数据源」,目前支持
:prometheus、victoriametrics 、thanos、m3、elasticsearch
、loki 等数据源。 完成数据源接入之后,就可以十分方便地通过可视化的方式查看日志了
。 夜莺默认提供了一些可视化大盘(菜单位置:「仪表盘」-「内置仪表盘」)和内置告警规则(菜单位置 :「告警管理」-「内置规则」),导入自己的业务组(这是个管理概念,不同的告警规则和仪表盘可以使用不同的业务组分门别类管理 + 控制权限)就能使用啦。 夜莺的仪表盘展示效果美观、性能出众、功能丰富
,虽然还没有 Grafana 的全面 ,但基本可以作为 Grafana 的国产化平替了
。夜莺的仪表盘支持暗黑主题,效果如下 : 前端 GitHub 地址:https://github.com/n9e/fe 如果之前没有做过监控数据收集,可以使用夜莺团队提供的采集器 categraf ,这同样是一款开源的 telemetry 数据采集器,它内置了 OS 、SNMP、IPMI、MySQL、Redis、MongoDB
、Oracle、Kafka、ElasticSearch 、cAdvisor 等多种采集插件。 GitHub :https://github.com/flashcatcloud/categraf 当然
,也可以使用其他采集器,比如 telegraf、grafana-agent 等
,但是 categraf 的对接最为丝滑。夜莺支持多种数据接入协议,比如 prometheus remote write
、OpenTSDB 、Datadog 等,接收到数据之后做统一转换,然后转发给后端时序库,具体转发给哪些时序库可以在夜莺的配置文件中配置
。 灵活的告警是优秀监控系统的标配,夜莺在这方面做得十分出色。它可以将一套规则应用于多个数据源,支持级别抑制 、生效时间 、告警屏蔽
、告警订阅、告警自愈等规则。 菜单「告警管理」-「规则配置」的界面和示例如下 : 监控并不仅仅是可视化+告警那么简单,里面有很多道道
,下面让我们“往下”走一点,深入了解下夜莺监控的架构和解决的痛点。 夜莺作为一款 Go 写的监控系统 ,不仅部署方便,而且整体设计上非常开放和灵活
,可以和开源生态上其他软件组合使用
,适用于已有监控系统升级或从零搭建监控平台等场景。 架构图如下 : 从依赖上看 ,夜莺就只依赖 MySQL 和 Redis,它俩对于技术人员来说,都是非常熟悉的
。除此之外,夜莺在部署时只需一个二进制文件 + 配置文件,将开箱即用的精神贯彻到底! 下面简单介绍一下夜莺的项目结构
,即核心功能模块介绍 ,方便想要深入了解夜莺的同学快速进入源码。 你是否遇到过需要监控多机房的场景 ? 目前,大多数公司都有很多机房,它们分布在不同的区域,这让监控变得不再简单
。因为如果机房之间网络链路很好 ,那么只需要部署一套监控系统就搞定了。但如果机房之间的网络不太好,无法做到监控数据实时、可靠的上传
,但是告警规则又想在一个中心管理。 这个时候就需要高级部署方案
,夜莺提供了现成的边缘机房部署方案
,可以方便地解决上面的问题。架构图如下
: 通过夜莺提供的高级部署方案,即在网络不好的机房(边缘)部署(下沉)时序数据库和告警引擎(n9e-edge) ,从而保证数据不丢失和告警规则的同步
,轻松构建统一的监控中心,实现多机房监控只需管理一套告警规则和可视化平台 。 真·企业级监控和告警一体化解决方案! 开源的监控系统 ,目前用的比较广泛的是 Zabbix 和 Prometheus,但它们或多或少都有一些不擅长的场景。 Zabbix 擅长设备监控,对各类操作系统 、网络设备有较好的兼容适配,但是不擅长微服务和云原生环境的监控
。 Prometheus 擅长微服务和云原生环境的监控,基本已经成为 Kubernetes 的标配,在云原生环境下非常流行,但它也有缺点。 夜莺作为一款开源的云原生监控系统
,在云原生方面有着先天优势 ,而且使用国外的开源监控项目 ,最担心的就是没有技术支持,夜莺作为“100% 国产”开源项目,在技术支持上分为社区支持和商业支持(响应更及时)两种
,服务的企业用户已有上千家
,比如移动、联通、电信、米哈游、莉莉丝、方正证券、国泰君安、海底捞 、海康
、搜狐 、新浪等
,分布在各行各业。 最后 ,还是那句话
:开源不易如果觉得夜莺监控不错的话,就请给个 Star 支持一下 ,试用反馈遇到的问题
,也是对开源的一种支持! GitHub
:https://github.com/ccfos/nightingale 官网:https://flashcat.cloud/一、款k控系夜莺监控
图片
图片
图片
图片二、安装启动
图片三 、快速上手
3.1 配置数据源
图片
图片3.2 好看的仪表盘
图片3.3 采集器
3.4 告警管理
图片四、深入了解
4.1 架构介绍
图片4.2 项目结构
4.3 多机房场景
图片五
、最后
图片