V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
risan
V2EX  ›  程序员

利用神经网络(MLP)做回归分析,输入的参数有 8 个属性以此来回归参数 Y,数据量大约 9 万条,模型的 mape 是 18%左右,还有优化空间吗?

  •  
  •   risan · 108 天前 · 981 次点击
    这是一个创建于 108 天前的主题,其中的信息可能已经有所发展或是发生改变。

    1 万条训练出来的模型和 8 万条训练出来的性能差不多,个人认为这个模型能做到 18%已经是极限了。

    4 条回复    2024-07-31 11:12:54 +08:00
    Sawyerhou
        1
    Sawyerhou  
       108 天前 via Android
    是说输入特征有 8 个吗?如果是,这么点输入没办法用神经网络拟合,树类模型应该都跑不满,直接多项式回归试试?
    volvo007
        2
    volvo007  
       108 天前
    听起来应该有优化空间。我遇到的很多新手都是特别迷信模型,觉得好像用了一个模型就可以拯救世界。实际上数据清洗和特征工程占到了一般 ds 项目的 60% 甚至更多的时间。

    去做做特征工程吧,不是简单的什么最大值、最小值、中位数,而是从业务角度出发看看有没有哪些特征是重要的

    最近的一个例子是,乙方帮我们建模,也是搞了半天准确率上不去,还说就只能这样了。我一看,你这些数据前一个影响后一个,有因果关系,都不是独立同分布的搞毛。换了个思路,模型几乎没动,准确度马上提升一大截。
    risan
        3
    risan  
    OP
       107 天前
    @Sawyerhou 属性有 8 个,总共有 9 万条这样的记录。
    Sawyerhou
        4
    Sawyerhou  
       107 天前 via Android
    @risan 数据量再大也没用啊,要不就像楼上哥们说的做下特征工程,扩充下输入数量。

    而且 9 万也不够,神经网络数据量最小也要百万量级。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   996 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:48 · PVG 05:48 · LAX 13:48 · JFK 16:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.