V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tomsun28
V2EX  ›  程序员

裸辞做了一款监控告警服务, v 友们有兴趣来试用一波

  •  3
     
  •   tomsun28 ·
    tomsun28 · 2022-02-13 22:51:48 +08:00 · 10461 次点击
    这是一个创建于 1042 天前的主题,其中的信息可能已经有所发展或是发生改变。

    先贴地址 官网 https://tancloud.cn 控制台 https://console.tancloud.cn 东西还比较粗糙,期望值不要太高哦。

    简单说下情况,之前坐标成都在 h3c 做 apm ,待遇还行有个三年激励,业余时间也一直在做其它开源,去年底想出来自己搞,于是就出来在家东搞搞西搞搞,从开始的鸡血状态,到两天摸鱼三天晒网时不时被小伙伴三缺一,再到后面又打鸡血哼哧哼哧,出来了这么-个项目😂。

    目前的功能有 支持网站,API ,PING ,端口,数据库的监控,自由化的告警配置,告警通知,告警模版,自定义监控等,如果不想试用可以看 B 站演示视频了解大概 https://www.bilibili.com/video/BV1Vi4y1f7i8

    对了代码全部开源,有兴趣的小伙伴欢迎一起搞。

    github: https://github.com/dromara/hertzbeat

    gitee: https://gitee.com/dromara/hertzbeat

    最后再脸厚点要个 star

    60 条回复    2022-12-03 18:12:34 +08:00
    sunorg
        1
    sunorg  
       2022-02-13 22:59:21 +08:00 via Android
    点赞支持。

    但这个没法盈利,生活成本出发的话,楼主值得拥有更好的。
    daoqiongsi1101
        2
    daoqiongsi1101  
       2022-02-13 23:05:14 +08:00
    视频里看到 chrome 有个插件,logo 像是一只猫在跑,好奇是什么插件😄
    idoubi
        3
    idoubi  
       2022-02-13 23:09:16 +08:00
    佩服楼主裸辞做开源的勇气。
    tomsun28
        4
    tomsun28  
    OP
       2022-02-13 23:11:15 +08:00
    @sunorg 谢老哥支持。目前想的是走 APM+SAAS 的路线 也不知道行不行的通 想的是先干一年 不行又再去打工😂。
    @daoqiongsi1101 不是 chrome 插件 这软件叫 runcat 它可以根据 CPU 跑快跑慢 比较乖强烈推荐。
    linglin0924
        5
    linglin0924  
       2022-02-13 23:11:56 +08:00
    可以去 host,loc 论坛发发,找找 idc 、运维圈子的人,他们会对这些监控感兴趣。
    tomsun28
        6
    tomsun28  
    OP
       2022-02-13 23:16:07 +08:00
    @idoubi 😁😁
    @linglin0924 谢谢这提醒我了 后面操作起来
    waler
        7
    waler  
       2022-02-13 23:17:56 +08:00
    很棒,数据库可以支持的多一些吗?比如 mssql
    lscho
        8
    lscho  
       2022-02-13 23:24:14 +08:00 via iPhone
    登陆--登录
    haoji
        9
    haoji  
       2022-02-13 23:34:36 +08:00
    当个种子用户试用一下,希望用习惯了 SAAS 版收费后有惊喜
    Valid
        10
    Valid  
       2022-02-13 23:35:44 +08:00
    最近发现一个优雅的 apex.sh 告警服务
    Valid
        11
    Valid  
       2022-02-13 23:36:51 +08:00
    这个 logo 应该是侵权 pinterest 的
    Yukineko
        12
    Yukineko  
       2022-02-13 23:54:57 +08:00
    支持一下,后面做项目的时候看看
    littlewing
        13
    littlewing  
       2022-02-14 00:41:27 +08:00
    文档里面的 “前言” 可以删掉,或者放到 “关于我们” 里面去
    littlewing
        14
    littlewing  
       2022-02-14 00:43:31 +08:00
    另外,这个排版的对齐方式怎么那么奇怪
    ![]( https://s3.bmp.ovh/imgs/2022/02/199520c5956ff06b.jpg)
    tomsun28
        15
    tomsun28  
    OP
       2022-02-14 00:59:08 +08:00
    @waler mssql 会的。后面计划支持通用的数据库还有更多的性能指标,数据库 中间件 操作系统 云原生 等
    @lscho 有些用登陆和登录 这块我也弄不清了
    @haoji 谢谢老哥反馈验证码问题
    @Valid 当时是在 figma 随手改了个 logo 就拿来用,版权这块是我意识淡薄了,之后重新设计个替换掉
    @Yukineko 😁😁
    @littlewing 仔细看确实对齐没有居中 美化页面对我有点吃力😂
    zaunist
        16
    zaunist  
       2022-02-14 01:22:51 +08:00
    这个和 skywalking 这些对比有什么优势吗?
    FindHao
        17
    FindHao  
       2022-02-14 02:54:20 +08:00 via Android
    和监控宝,uptimerobot 之类的相比,优势是什么?
    shuimugan
        18
    shuimugan  
       2022-02-14 04:10:43 +08:00
    可以考虑做"云的最后一公里",整合多个云平台的监控信息.

    目前看来开源的类似项目有滴滴的夜莺,商业项目有睿象云.

    不过我之前用下来这些告警项目还是比较原始,比如"一条慢 sql 根据调用的表能直接触达到具体的研发团队和相关产品的功能"满足不了,更别说结合其它链路的日志分析出一个 502 背后可能产生的原因,也就是偏向 AIOps 部分
    shuimugan
        19
    shuimugan  
       2022-02-14 04:22:21 +08:00
    监控告警想做好,CMDB 少不了,最后演进的路线就是 AIOps,这块坑还是挺大的.
    我之前试用腾讯蓝鲸那套体系发现真的是又菜又爱吹,混乱无比,真正用起来那叫一个难受.
    CMDB 项目两万多的提交大部分都是写废话(新增 /修复了 xx 条件的查询支持),还不如用低代码配个 CURD 界面 + 定时器采集.
    流程编排又菜 bug 又多,还不如用 node-red 拖拉拽结合 ansible 简单高效.
    focuxin
        20
    focuxin  
       2022-02-14 08:43:01 +08:00
    感觉和我之前公司另一个组做的产品比较像,还要页面上面应该是登录而不是登陆吧
    cismous
        21
    cismous  
       2022-02-14 08:49:27 +08:00
    用了多久时间?
    jsnjfz
        22
    jsnjfz  
       2022-02-14 09:03:02 +08:00
    看起来不错,先支持下!!
    chenshun00
        23
    chenshun00  
       2022-02-14 09:19:24 +08:00
    这个应该不是 APM 吧,我看 Git 里边也没有字节码相关的代码。

    一条慢 sql 根据调用的表能直接触达到具体的研发团队和相关产品的功能 这个功能做好确实挺赞的。

    还有例如 RDS CPU 100 直接触达到某个项目负责人,这种做起来不容易的。
    YaakovZiv
        24
    YaakovZiv  
       2022-02-14 09:33:38 +08:00
    如果目标客户有运营商,功能得多考虑报表生成和导出。
    比如导出某个时间段某个资源利用率。某个时间点,指定资源排序。某个资产或资源的汇总导出为 excel 。
    界面挺好看,支持楼主。
    guisheng
        25
    guisheng  
       2022-02-14 09:38:27 +08:00 via iPhone
    看起来不错。已 start
    binge921
        26
    binge921  
       2022-02-14 09:39:44 +08:00
    支持楼主 我也是从事相关行业 目前对接过 h3c 和华为的虚拟机监控 我公司也有一套成熟的 apm 监控 不过都是开源框架踩坑过来的 不知道楼主这个咋样 试试先
    tomsun28
        27
    tomsun28  
    OP
       2022-02-14 09:57:34 +08:00
    @zaunist
    skywalking 做链路追踪的还不涉及 现在就是服务监控告警
    @FindHao
    之前就是看了 uptimerobot 感觉这块可以搞,优势如果硬说的话可能就是本地化 开源吧 但其实现在和他们距离还很大
    @focuxin 用的就是登录咋 登陆登录我有点懵了 也不知道哪个对
    @cismous 开发吗 目前几个月
    @jsnjfz 谢谢支持
    tomsun28
        28
    tomsun28  
    OP
       2022-02-14 10:05:23 +08:00
    @shuimugan 整合多个云平台的监控信息 - 这个还是需要自己做个平台 然后对接 工程量比较大对我来说有点难 确实监控告警到后面基本上都是要做 CMDB ,自动发现,业务可视化的,目前想的是先把监控告警搞好 毕竟精力有限 后面再看能不能去做这些 蓝鲸我也试用过 感受+1
    @chenshun00 这个不涉及链路追踪 之前是感觉链路追踪是不好上云的 毕竟 agent 是必须的
    RDS CPU 100 直接触达到某个项目负责人 - 这个确实 有想法把告警这块搞好点 易用点
    tomsun28
        29
    tomsun28  
    OP
       2022-02-14 10:13:15 +08:00
    @YaakovZiv 作为一个后端狗第一次被夸界面好看 哈哈谢谢 还是就是谢谢报表的建议
    @guisheng 😁😁谢 star
    @binge921 老哥先试试,有兴趣可以加个微信 tan-cloud 行业交流下哈哈
    james2013
        30
    james2013  
       2022-02-14 10:28:35 +08:00
    佩服,不过还是早点找个厂上班吧,浪费时间
    实际上这个已经有现成的框架了,前段时间我试用了开源的 uptime-kuma,功能和界面比你的好用的多
    Geekerstar
        31
    Geekerstar  
       2022-02-14 10:40:12 +08:00
    之前项目用过楼主开源的那个 shiro url 鉴权项目
    yulgang
        32
    yulgang  
       2022-02-14 10:47:42 +08:00
    佩服
    clf
        33
    clf  
       2022-02-14 10:59:01 +08:00
    @tomsun28 #4 那么问题来了,到底是因为 CPU 负载高了猫才跑的快了,还是因为猫跑快了导致 CPU 负载高了( doge ,开个玩笑,之前下这个猫猫的时候看到的梗)
    codepark
        34
    codepark  
       2022-02-14 11:02:38 +08:00
    我们公司就是做这个的,不管是 SAAS 或者是 to b 银行企业 都没什么销路,现在转行搞了智能运维。还是加油 ~
    tomsun28
        35
    tomsun28  
    OP
       2022-02-14 11:47:08 +08:00
    @Geekerstar @yulgang 😁
    @clf 这样就循环了哈哈
    @james2013 @codepark 感觉有点凉凉,不管了先试着一年 不行再去找个厂打工吧
    exiaohao
        36
    exiaohao  
       2022-02-14 12:42:08 +08:00
    来试试~
    楼主有准备搞 SaaS + Agent 的方式吗?感觉可以探测的范围可以更深入一些
    tomsun28
        37
    tomsun28  
    OP
       2022-02-14 13:38:15 +08:00
    @exiaohao 之后有想法搞,先把 prometheus 的协议适配了 这样它的 agent--exporter 可以集成进来
    yisany
        38
    yisany  
       2022-02-14 13:49:24 +08:00
    加油。之前做过很长一段时间的这个,还是得用 Saas + agent 的方式功能才强大。
    ersic
        39
    ersic  
       2022-02-14 14:03:20 +08:00
    @Valid 试了试,感觉很不错,很简洁但不简单,统计图表看着很舒服。
    bulay
        40
    bulay  
       2022-02-14 14:09:51 +08:00
    @exiaohao agent 是也是一个大块,除非集成开源.高并发,安全性,上报数据,连接不同时候有没有缓存等等有许多问题
    night98
        41
    night98  
       2022-02-14 14:14:54 +08:00
    我说 SA-Token 咋突然不更了,哈哈,原来跑来搞这个了,有空试用下
    maypu
        42
    maypu  
       2022-02-14 14:21:11 +08:00
    设置里面手机号露出来了
    WestXu
        43
    WestXu  
       2022-02-14 14:32:56 +08:00
    现在用的 uptime-kuma 简单好用
    Mrsssi
        44
    Mrsssi  
       2022-02-14 14:52:31 +08:00
    @daoqiongsi1101 mac 的一个 app runcat
    scanjx
        45
    scanjx  
       2022-02-14 15:47:17 +08:00
    说实话,可用性不高,监控指标过少,没有 CMDB 关联资产分组管理,权限划分等等,仪表盘做的很一般,只能说勉强可视化,但用处不大,手机号码记得隐藏一下,上面说的蓝鲸虽然垃圾,但是还是有一定参考性的,建议参考一下
    luffy
        46
    luffy  
       2022-02-14 16:00:56 +08:00
    楼主可以介绍下你自己嘛?
    luffy
        47
    luffy  
       2022-02-14 16:03:22 +08:00
    楼主大哥,既然做了开源,又是全中文 commit + comment, 看来是不打算让外国人加入了。
    OneMan
        48
    OneMan  
       2022-02-14 16:57:19 +08:00
    成都人啊,不错
    OneMan
        49
    OneMan  
       2022-02-14 17:01:00 +08:00
    貌似是个重复轮子,解决了其他监控平台不太好的问题吗?
    wangyzj
        50
    wangyzj  
       2022-02-14 17:21:00 +08:00
    想法很好
    但不赚钱
    或者说很难盈利
    vophan1ee
        51
    vophan1ee  
       2022-02-14 17:32:12 +08:00
    建议 GitHub 上可以挂一个英文版的 readme
    oh
        52
    oh  
       2022-02-14 17:54:46 +08:00
    打不开
    tomsun28
        53
    tomsun28  
    OP
       2022-02-14 18:19:48 +08:00
    @yisany 道友啊
    @night98 你应该说的是社区另一个哥们
    @maypu 收到注意
    @scanjx 谢谢建议 现在精力有限只能先弄监控告警,后面更多监控类型指标和功能会跟上
    @luffy 上面简单介绍了咋 可不要让我报身份证啊 之前项目 https://github.com/dromara/sureness 开始走全英文路线,试了感觉效果不好 现在想的是先走中文 后面再慢慢补上英文
    tomsun28
        54
    tomsun28  
    OP
       2022-02-14 18:23:08 +08:00
    @OneMan 😁
    @wangyzj 能预计到基本很难赚钱 先边走边看吧
    @vophan1ee 收到 后面挂一个
    @oh 哥们是哪个地址打不开了
    xiaozizayang
        55
    xiaozizayang  
       2022-02-14 20:59:37 +08:00
    请问官网用的什么主题
    jousca
        56
    jousca  
       2022-02-14 21:19:21 +08:00
    这玩意儿还可以,我一直用的是监控宝
    thisisgpy
        57
    thisisgpy  
       2022-02-14 23:39:20 +08:00
    去我老东家 perfma 吧,那里适合你,有专门的 APM 产品线。
    opengps
        58
    opengps  
       2022-02-15 08:54:01 +08:00
    小建议,mysql 监控这么敏感,可以给带上白名单 ip 参数,表名身份,不然咋敢暴露
    tomsun28
        59
    tomsun28  
    OP
       2022-02-15 12:09:26 +08:00
    @xiaozizayang 用的是 ant-zorro 加 ng-alain
    @jousca 监控宝很全很强
    @thisisgpy 等一年看再去打工
    @opengps 确实后面看加上,目前是密钥全链路加密,建议也是用只 query 的运维权限账号去调用
    wuleiisme
        60
    wuleiisme  
       2022-12-03 18:12:34 +08:00
    其实不缺监控告警工具,缺的是告警发出后,对告警事件的管理工具。免费开源的好像只有 alerta 一款。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2750 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 11:37 · PVG 19:37 · LAX 03:37 · JFK 06:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.