RT
猜测是匹配文件的 MD5 共享链接,因此出错率应该相当低?
然而 谷歌硬盘 似乎没有这方面特性。
比较好奇是因为谷歌的硬盘足够多,不需要多人链接同一个文件,
还是其他什么原因?
综上。
1
loading 2015-12-20 17:00:41 +08:00 via Android 1
因为,版权问题!
国内秒传的,基本都是电影… 正常来说,能出现海量 md5 一样的文件,除了是涉及版权的东西,我想不到其他巨大的文件! |
2
v1024 2015-12-20 17:03:02 +08:00 via iPhone 1
安全问题,碰撞 md5 到其他人的私人文件=泄漏
|
3
Tiande OP |
4
f7ee9404 2015-12-20 17:20:54 +08:00 1
还有游戏
|
5
weaming 2015-12-20 17:28:03 +08:00 1
可以在 md5 基础上加些别的参数啊,比如创建日期,大小,什么的,不就可以大大减小碰撞几率了?支持秒传。
|
6
gamexg 2015-12-20 17:35:07 +08:00 1
怕碰撞吧?
即怕人恶意碰撞,也怕非恶意碰撞照成丢失文件、泄露隐私之类的问题。 印象中 onedrive 第一次也是不会秒传。 一直都好奇理论上讲绝对会出现 md5 碰撞的情况,即使多个 hash 同时使用也会出现碰撞。有数学大牛给计算一下以百度云的规模碰撞几率有多大吗? |
7
Tiande OP @weaming 大文件秒传确实很爽。 cdate mdate 可以随意改,加到一起算可以减少碰撞,但也没法匹配相同文件了吧。
|
8
loading 2015-12-20 18:21:03 +08:00 via Android 1
那只能说谷歌很聪明,如果出现秒传,别人就能用有版权的文件去测试,如果出现秒传,不就能告谷歌了?
谷歌有的是带宽,你传上去,先对 md5 ,如果一样,对什么时间这些,最后,一个个字节对一次…一样就 |
9
8e47e42 2015-12-20 18:26:42 +08:00 1
有啊有啊,有不点名的网盘比较的是文件名+修改日期+文件大小,分分钟泄成渣
|
10
fzinfz 2015-12-20 18:38:38 +08:00 1
OS 和存储硬件都能做到数据去重,服务器上不一定存储多份相同文件
比如: https://technet.microsoft.com/en-sg/library/hh831602.aspx google: Data Deduplication EMC/netapp/IBM/... 秒传又是另一个话题了 |
13
KexyBiscuit 2015-12-20 21:54:28 +08:00 via Android 1
因为保护用户隐私,秒传需要扫描每个用户的文件并生成唯一特征码,尽管不能由此直接复原出文件,仍有几率间接碰撞。
不,不是说海外网盘不扫描你的文件, OneDrive 要扫描的,禁止儿童色情等内容。除此之外,不侵犯用户隐私。 |
14
c742435 2015-12-20 22:19:39 +08:00 via Android 1
两个问题,
1 是如果你上传了小黄片,别人之前上传过,然后你妙传了。然后别人被举报了 然后你的片没了。 2 是,有极低可能,比如苹果的新 Xcode 发布了,有人通过 md5 碰撞,预先上传了包含恶意代码但是 md5 和正常 Xcode 一样的文件,然后你上传的时候是妙传,但是下载的时候包含恶意文件 不过我觉得后者可能性非常小 |
15
sandideas 2015-12-20 22:26:54 +08:00 1
md5 碰撞的概率太低了。。相同大小再碰撞的概率更低吧
|
16
zjqzxc 2015-12-20 22:47:28 +08:00 1
已验证百度网盘是仅做 md5 验证(两年前试验过,现在不清楚)
md5 碰撞几乎是不可能的;首先文件大小都不同,根本都用不着 md5 ; 文件大小相同 md5 还相同,真能遇上这事儿感觉出门买彩票去 @c742435 感觉理论上后者几乎不可能发生;如果保证修改后文件大小一致,还包含恶意代码,还不破坏原始文件的执行,真有这技术还用来黑 xcode 干嘛。。。 |
17
zado 2015-12-20 23:50:16 +08:00 1
MD5 “天然”碰撞几乎不可能出现,但是人为制造现在已经很简单了,早就有报版权保护组织通过故意制造碰撞的方法来阻止 BT 传播盗版。
|
18
alect 2015-12-21 00:52:26 +08:00
网服务器传输内容的时候,貌似本来也不用花费服务器商什么成本,因为他们注重的是下载而不是上传。。你给他传东西基本上可以做到不限制,而他传给你则要付出比较大的成本
他可以让你先传进去,让你以为没有相同的文件,然后他存储的时候判断是否有一一样的文件,不会多次重复存储。 我觉得国内的这些秒传更多的是考虑用户,因为大家的上传带宽太小,既然你都传了干脆传之前判断一下 MD5 ,你高兴就好。。 |
19
Tink 2015-12-21 02:17:49 +08:00
文件还没上传上去的时候这个 md5 是咋出来的啊
|
22
sneezry 2015-12-21 02:44:20 +08:00 via iPhone 1
@Tink 磁力链接里就包含文件特征了,所以不用上传就秒传也说得通。但是如果 web 页面从本地选文件出现了秒传就说不通了,可以试试百度云,网页上传在不装浏览器插件的情况下是不能秒传的
|
24
hqs123 2015-12-21 08:29:25 +08:00
妙传都是些热门东西,服务器都有备份的
|