V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
TimeH
V2EX  ›  酷工作

[大模型公司] [北/上/深] LLM/多模态/SFT/强化学习/训练/推理研发

  •  
  •   TimeH · 231 天前 via iPhone · 1221 次点击
    这是一个创建于 231 天前的主题,其中的信息可能已经有所发展或是发生改变。
    创始人清华背景,具备公司上市成功经验,技术理想主义者。
    核心团队由百度、华为、微软、字节、腾讯等知名大厂以及海外技术精英,业界技术大牛,科学家。
    目前估值 15 亿美金以上,成功的 2b 、2c 产品落地。
    微信&电话:15210750729
    邮箱: [email protected]
    地点:北京/上海

    大模型算法专家
    岗位职责
    1.负责基于海量数据的 NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
    2.深入调研和关注大模型/多模态等方向的前沿技术
    职位要求
    1.参与或者领导过大规模预训练模型落地项目。
    2.对预训练大模型充满热情,信仰 AGI 。
    3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。

    分布式训练工程师
    职位职责:
    1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。
    2. 优化模型结构,提高模型的精度和泛化能力。
    3. 调优训练数据,提高模型训练效果。
    4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。
    职位要求:
    1. 精通分布式训练算法,具备超大规模模型训练的实际经验。
    2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow )。
    3. 熟悉常用的模型结构和优化方法,例如 CNN 、RNN 、BERT 、GPT 等。
    4. 熟悉数据调优和数据增强等相关技术。
    5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。
    6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。

    推理研发工程师
    岗位职责:
    1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
    2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
    3. 负责 LLM 模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
    要求:
    1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
    2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
    3. 熟悉常见的深度学习框架,如 TensorFlow 、PyTorch 等,并能够根据业务需求进行算法实现和调试。
    4. 熟悉 LLM 相关的算法技术以及推理加速方法。
    5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。

    对齐算法工程师
    1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning 、多轮对话等能力;
    2.持续跟进业界最新的大模型对齐算法,参与大模对对齐算法的设计、训练、调优工作;
    职位要求
    1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上 NLP 相关经验;
    2.熟练使用 pytorch/tensorflow 深度学习框架,熟练掌握 Transformer 框架;
    3.对 LLM 有深入理解和实践,有 SFT 、RLHF 相关经验者优先;
    4.较强的工程实现能力,熟练掌握 C/C++, JAVA,Python 等至少一种语言;

    搜索增强算法
    主要职责:
    1. 设计和实现基于深度学习的搜索增强大模型,提高搜索结果的准确性和相关性。
    2. 开发和优化多模态检索与混排算法,包括图像、视频和文本等,以提高跨模态搜索的性能。
    3.分析和优化搜索算法的效果,通过数据驱动的方法持续提升搜索系统的表现。
    4.与产品团队合作,理解业务需求,为搜索系统的设计和优化提供技术支持。
    跟踪最新的搜索增强和多模态处理技术,探索并应用技术以改进现有系统。
    任职要求:
    1. 计算机科学或相关专业硕士及以上学历,具备搜索推荐或自然语言处理背景。
    2. 至少 2 年的大模型算法研发相关工作经验,熟悉深度学习框架(如 TensorFlow 或 PyTorch )。
    3. 熟练掌握编程语言(如 Python ),具备良好的编程能力和算法基础。
    4. 具备良好的数据分析和解决问题的能力,能够独立进行算法效果评估和优化。
    5. 有强烈的责任心,良好的沟通能力和团队合作精神,对技术创新充满热情。
    6. 动手能力强,有实际项目经验者优先考虑。

    多模态算法工程师
    职位描述
    1.深入研究并探索视觉语言模型( VLM )、多模态大语言模型( MLLM )等尖端技术。跟踪多模态 AI 领域的最新技术动态,优化和改进现有技术和系统。
    2.研究多模态模型的训练范式,探索更高效的结合范式,并以此为基础发表高价值论文。
    3.探索多模态数据利用方式,对图文对, 图文交错等数据有更高效的使用方式。
    职位要求
    1.熟悉 Python, Linux, PyTorch 等深度学习必备知识,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识。
    2.有在 ICLR 、ICCV 、CVPR 、ECCV 、NeurIPS 、ICML 、TPAMI 、ACL 、EMNLP 等国际顶级会议和期刊上发表成果的优先。
    3.熟悉预训练算法的历史,熟悉对比学习,MAE 等大语言模型之前的预训练算法,有 Visual-Language Model 和大规模语言模型( LLMs )方面的经验者优先。
    4.熟悉 Flamingo, Llava, Fuyu 等多模态大模型的基本原理与优劣,熟悉 MMMU, MathVista 等多模态评测方式
    5.具备优秀的团队合作意识和沟通能力,出色的自我驱动和抗压能力,强烈的求知欲和技术热情,优秀的数据分析和逻辑思维能力。

    6.对多模态模型如何提升当前语言模型能力有独到的见解

    7.博士及以上学历(或者参与过出知名多模态项目的硕士)
    4 条回复    2024-04-14 10:40:23 +08:00
    shm7
        1
    shm7  
       231 天前
    现在分的这么细了哇
    DavidDee
        2
    DavidDee  
       231 天前   ❤️ 1
    建议最后一条放第一条
    Jana
        3
    Jana  
       231 天前
    基座模型那那边需要博士学历 和 领导过大规模预训练模型落地项目么?
    TimeH
        4
    TimeH  
    OP
       215 天前 via iPhone
    @Jana 最好是博士学历,背景优秀的硕士亦可,大模型算法经验是必要的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5240 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 09:26 · PVG 17:26 · LAX 01:26 · JFK 04:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.