V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
guoyuqi
V2EX  ›  酷工作

[杭州][阿里巴巴-智能信息] 招聘离线数据系统研发工程师(大模型爬虫方向)

  •  
  •   guoyuqi · 11 天前 · 1596 次点击
    团队 nice ,发展空间大,业务蓬勃发展

    职位描述
    1. 参与互联网网页、文档、图片、音视频等境内外内容数据的发现、采集及处理
    2. 优化爬虫架构及平台能力,优化 js 渲染性能和效果,提升反爬对抗能力
    3. 优化数据处理系统,完善数据标注等平台能力
    4. 负责大模型训练语料、RAG 索引等重要数据的交付
    职位要求
    1. 编程基本功扎实、熟悉常用数据结构和算法,有大规模、分布式数据处理的经验
    2. 熟悉网页、文档、图片及音视频处理技术的优先考虑
    3. 有浏览器内核开发、爬虫对抗经验的优先考虑
    4. 对搜索业务、大模型及相关行业有较深理解的优先考虑

    https://talent.quark.cn/off-campus/position-detail?lang=zh&positionId=7000002205


    有意请发简历到 robinguo422#gmail.com (# 替换成 @)
    4 条回复    2025-03-17 20:25:16 +08:00
    lasuar
        1
    lasuar  
       11 天前
    这爬虫 JD 写的好斯文啊,是不是大模型优化过的。
    guoyuqi
        2
    guoyuqi  
    OP
       11 天前
    @lasuar 还好吧,官网的 jd 不得正式点
    guoyuqi
        3
    guoyuqi  
    OP
       9 天前
    夸克是阿里现在全力发展的业务,前进广大,hc 还有 2 周截止,不要错过
    maxwel1
        4
    maxwel1  
       8 天前
    这么巧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4603 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 05:36 · PVG 13:36 · LAX 22:36 · JFK 01:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.