这是一个创建于 2689 天前的主题,其中的信息可能已经有所发展或是发生改变。
之前因为 es 挂了,导致 redis 阻塞,应用写入一直在等待,直到机器上所有进程都被阻塞。
期望是让 log 的功能更完善,更灵活,如果当某种通道出现故障的时候,不可影响应用程序
1 如何判断出通道故障了?比如 10 秒内连续出现错误
2 自动关闭该通道,或切换至其他通道
3 尝试自动恢复该通道
4 报警手段 + 恢复后提醒手段
有没有什么其他的思路,请大家指教,小弟对这个项目还不是很熟,可能描述的不是很清楚。希望大家指点指点。
 |
|
1
tlday 2017-12-03 11:27:12 +08:00 via Android
1 的话,kafka 加消息从产生到消费之间延迟的检测? 2,4,查找微服务的服务发现,负载均衡相关的东西。3,守护进程通知重启吧,挂的原因是未知的,可能很难自动化。重启解决大部分问题,然后记录下重启前的事故现场,分析以便以后作规避吧。 我的经验也不多,看看楼下怎么说。
|
 |
|
2
tlday 2017-12-03 11:28:15 +08:00 via Android
发帖的节点似乎不是很合适
|