V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Albud
V2EX  ›  程序员

新手想问问 Linux 系统跑深度学习和 SAM,求大佬解答

  •  
  •   Albud · 258 天前 · 1174 次点击
    这是一个创建于 258 天前的主题,其中的信息可能已经有所发展或是发生改变。
    目前一直是使用的 windows 系统,最近因为学习需要,要用深度学习做一下耕地地块的提取。了解后发现比较常用 SAM 一些模型。所以,想问一下,我要是想用 linux 系统的话,用哪个虚拟机装比较好呀? 我看很多教程都是推荐使用 VM ,也有推荐别的的,就是不知道差别在哪。弄错了再重新整也很麻烦。所以有没有懂的大佬能讲一讲?,避一避坑。
    18 条回复    2024-04-28 10:47:55 +08:00
    Albud
        1
    Albud  
    OP
       258 天前
    哦对,还有最新的 mamba 模型
    RichardML
        2
    RichardML  
       258 天前
    直接双系统呢?我自己的是 windows+linux+mac 三系统装在一块固态上了,又加了一块当仓库盘
    Ariake265
        3
    Ariake265  
       258 天前
    耕地地块是不是类似于遥感图像哪一种?直接用 SAM 做可能会有 domain shift ,效果可能不好的。微调 SAM 就没意思了,还不如上一个小模型。
    wxg4net
        4
    wxg4net  
       258 天前
    Linux 不用虚拟机,用容器吧 ,欢迎使用 archlinux
    Albud
        5
    Albud  
    OP
       257 天前
    @RichardML 双系统和虚拟机开 linux 有啥区别呀? 是能利用更多的算力是吗?
    Albud
        6
    Albud  
    OP
       257 天前
    @wanghr64 是的是的,就是从遥感影像上提取。准备做一个目标检测的模型,然后传 prompt 给 SAM 。 是的呀,直接用应该不太行, 小模型不知道都有啥呀? 目前看论文常用就是 UNET 和 unet 的变形啥的,最新的论文基本都用 sam 这类了。
    Albud
        7
    Albud  
    OP
       257 天前
    @wxg4net 好的,我试一下看看,谢谢您
    Albud
        8
    Albud  
    OP
       257 天前
    @RichardML 我刚查了一下,看了看区别,谢谢您的建议,我试试弄个双系统了。感谢!
    ysc3839
        9
    ysc3839  
       257 天前 via Android
    你要用 GPU 跑吗?用的话不能用虚拟机。
    不用 GPU 的话个人选择 VMware Workstation 。
    Ariake265
        10
    Ariake265  
       257 天前
    @Albud 我做医疗影像,最近也在水和 SAM 相关的论文。只能说加上各种 setting ,SAM 能有一些点可以出文章,但是实际在项目里面还是 u-net 类的甚至 yolo 会好用许多
    Albud
        11
    Albud  
    OP
       257 天前
    @ysc3839 是的,要用 GPU 跑的,不知道 一个 4090 能不能跑动....
    Albud
        12
    Albud  
    OP
       257 天前
    @wanghr64 mamba 有用过吗? 我本来是用的 AI earth 平台的那个深度学习模型。后来,老板看那个提取效果很好。因为算法不是自己的,就让自己做一个类似的,┭┮﹏┭┮ 。 之前有师兄用 u-net 类的去做,针对农场类的效果还行(但是他都毕业了那篇论文都还没中,返回意见是没有创新点) 那这样的话,就只能选个小区域然后对比一下各个模型喽? 实际项目里就选最好的交。
    andrewboom
        13
    andrewboom  
       257 天前
    一个 4090 应该能跑动,耕地地块的提取相关感觉用 ViT 效果会好一点?你样本量如果就几万张感觉 4090 都用不到
    Ariake265
        14
    Ariake265  
       256 天前
    @Albud 哦也是要发论文的,那就 SAM 、Mamba 上上上
    Albud
        15
    Albud  
    OP
       256 天前
    @andrewboom 啊,还没开始大量画样本,准备 5 月份画几万个来着。 这么说的话, 如果要在各种地区提取的效果好一点的话,这大概需要多少样本量呀?
    andrewboom
        16
    andrewboom  
       256 天前
    @Albud 基本上这东西肯定是越大越好,先尽量收集看效果再分析是样本量太小不够学习还是样本够了算法不行
    Albud
        17
    Albud  
    OP
       256 天前
    @andrewboom 哦哦,好的,好的,感谢!
    RichardML
        18
    RichardML  
       239 天前
    @wxg4net 我最近没有逛论坛,我个人使用的经验上总结的优缺点。
    优点:不用搞虚拟化方面的问题,系统直接利用的是硬件的性能,因为涉及到深度学习肯定要用到显卡,硬件虚拟化再怎么优化也会有损耗,配置 GPU 的直通又是一个需要解决的问题点(这个是我玩 PVE 的经验,硬件的直通消耗的精力有点多)
    缺点:双系统在一个时间点只能用一个系统,不和虚拟化一样可以同时使用两个系统,切换系统要重新引导进系统。要搞双系统最需要解决的问题是引导问题(不过我感觉比起硬件的虚拟化和直通比起来解决起来简单很多)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1216 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 23:28 · PVG 07:28 · LAX 15:28 · JFK 18:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.