像支付宝这种金融性质的平台是如何做异地容灾的？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

V2EX 提问指南

这是一个创建于 3514 天前的主题，其中的信息可能已经有所发展或是发生改变。

支付宝现在的后端数据库用的还是Oracle吗？几年前说是要迁移到PC Server+MySQL+Hadoop，不会只是说说的吧。

如果是MySQL，如何保证数据同步的实时性？

Oracle数据库应该有现成的异地灾备方案的吧？

数据库

Oracle

支付宝

20 条回复 • 2015-05-28 15:55:16 +08:00

youxiachai

2015-05-28 09:48:33 +08:00

这种东西,技术讨论,远远大于实际性...真出事了,你真敢切..?

youxiachai

2015-05-28 09:51:01 +08:00

补充一下,容灾肯定是有的,但是,要看实际的严重程度了.....

如果,是机房被炸了,完全没了,那这个时候也顾不上什么数据一致性了.

而如果像这次,突然断网了,等网络好,远远比切数据库对数据一致性,修网络的性价比最高

tabris17

2015-05-28 09:54:40 +08:00

@youxiachai 线路故障这种可以切换路由，现在机房都至少双线N线了吧

tabris17

2015-05-28 09:55:45 +08:00

阿里云什么的牛逼哄哄，其实也抵不过一铲子

youxiachai

2015-05-28 09:58:45 +08:00

@tabris17 所以这次故障2个小时就修好了.....而且,这次挖断的光纤,估计是主路由吧?所以,这次就有人吐槽阿里的BGP...不过,阿里云的杭州机房,貌似影响比较小

所以这次事故说明双线也不能百分百保障,7*24小时无事故运行

wy315700

2015-05-28 09:59:47 +08:00

@tabris17 切换路由全网广播也要时间吧。。。

fangjinmin

2015-05-28 10:09:33 +08:00

即使做了容灾，这么大的系统也是不可能实时恢复的。
容灾的对策，是真正出现了一个数据中心的数据完全不能恢复的情况下的备用方案。

容灾更多的不是技术层次上的内容了，是策略问题。
两个数据中心的数据一般说来是不可能同步的，特别是像支付宝这样庞大的系统。
一般说来数据是先备份到磁带或者光盘，或者硬盘中，然后送到异地数据中心保存。

tabris17

2015-05-28 10:17:27 +08:00

所以说，其实不管什么技术手段，都有自己的“一铲子”的命门。

无论是热备、双线机房、异地灾备、切换路由、或者智能DNS，好像没啥完美解决方案

9hills

2015-05-28 10:20:03 +08:00 via iPhone

高实时性系统，异地容灾数据一致性怎么解决。

比如北京和杭州异地容灾，任何交易必须双方均写成功才能生效，这个延时受不了啊

所以这种实时系统容灾也就隔上几十公里搞第二个IDC，这样延时很小。但是地震了一样躲不掉。

geeksu

2015-05-28 10:20:43 +08:00

5.27真实版的『板砖破武功』

tabris17

2015-05-28 10:22:24 +08:00

@9hills 每隔50km建立一个机房，一路连到西安

caoyue

2015-05-28 10:24:50 +08:00

异地多活数据流基础设施DRC --双11支持571亿交易额背后的武器
http://blog.sina.com.cn/s/blog_e59371cc0102vlgm.html
然而并没有什么卵用

讲真，考虑到交易数据强一致性的话，这种应该并不好做吧
不过阿里吹得太厉害，导致现在大家喜闻乐见了

jason52

2015-05-28 11:06:20 +08:00

@caoyue 这么说来，要是双十一杭州修路挖光缆，支付宝岂不药丸~~话说杭州还真是 IT 重镇，前段时间是网易，昨天还是支付宝。杭州政府压力应该很大~

julyclyde

2015-05-28 11:51:48 +08:00

@wy315700 真BGP并不是撤回故障再向另一个方向通告，而是本来就是多方向的

wy315700

2015-05-28 12:03:48 +08:00

@julyclyde

如果是BGP设备故障了呢，，或者

打个比方

如果一个BGP设备接了两个方向，电信和联通。
同一个IP，电信走电信过来，联通走联通过来

假设到电信的断了，那么电信的就不通，需要重新广播，把电信用户引导到联通那根线来
这么理解对不对。

tangooricha

2015-05-28 15:03:26 +08:00

@wy315700 故障时段BGP路由的发布没有发生变化，去BGPlay上看，就看出来了。

yanze0613

2015-05-28 15:20:00 +08:00

我只知道，之前号称oceanbase全面代替oracle了，然而异地多活考虑数据一致性，到时候能不能切，切了之后，数据差异部分的损失谁来承担，都是实际问题，不光是技术问题能解决的

tabris17

2015-05-28 15:31:24 +08:00

@yanze0613 “OceanBase数据库支持了多个重要业务的数据存储，包括收藏夹、直通车报表、天猫评价等”

我估计支付宝这种核心业务还在用Oracle数据库

yanze0613

2015-05-28 15:44:59 +08:00

@tabris17 然而之前是毕玄还是余锋说的来着，已经全面去IOE了

julyclyde

2015-05-28 15:55:16 +08:00

@wy315700 正经的不需要重新广播。