y = y^(1/5)
,类似这样越大的数据压缩越多,但还能保持相对位置关系。y = log2(y)
,因为数值没有小于 1 的,所以也还行。 1
ryd994 2020-02-24 13:34:18 +08:00 via Android
为什么不用浮点数?
|
2
ryd994 2020-02-24 13:36:04 +08:00 via Android
我懂你意思了。这要看情况。
论文和金融上用对数比较多 因为很多数据之间就是对数关系 所以对数转换之后就是一条直线,非常直观 |
3
ylrshui 2020-02-24 14:04:44 +08:00 via iPhone
当然是对数,把指数变化变为线性变化;开 5 次幂后的曲线无法直观观察数据变化
|
4
autoxbc 2020-02-24 16:10:30 +08:00
这个好像叫心理物理学,有两个著名定律
1. 韦伯-费希纳定律(Weber-Fechner law) 2. 斯蒂文思幂定律(Stevens's power law) 分别对应上面的两种数据处理方式 具体适用范围不知道,我觉得还是和数据来源有关 比如描述噪声的分贝等级是第一种 描述亮度变换的 Gamma 曲线是第二种 |
5
JCZ2MkKb5S8ZX9pq OP |
6
ylrshui 2020-02-24 23:11:45 +08:00 via iPhone
@JCZ2MkKb5S8ZX9pq 数据范围对开 5 次幂的影响较大,范围较小,开 5 次幂压缩太过,范围太大,压缩不够,这种方法处理出的数据仍是指数关系。对数则将指数关系转化为线性关系,数据范围的影响就要小的多,具有通用性
|
7
JCZ2MkKb5S8ZX9pq OP @ylrshui 测试了一下,数据直接用的新浪的 ncov,log 用的 e。
相对关系都能表现出来。 对数压缩完之后,数据更近一点。但通过调整底数或幂,都可以变。 对数计算好像快一丢丢。 对数 1 需要稍微做点处理,显示 0 的话不符合直觉。 简单来说,两种好像区别并不大。 |
8
JCZ2MkKb5S8ZX9pq OP @ylrshui 具体见 append 中的图片
|