主要负责 Ray 计算引擎,偏机器学习方向,当然纯计算方向也阔以~ 联系邮箱:
[email protected]关于 Ray:
https://github.com/ray-project/rayhttps://jobs.bytedance.com/experienced/position/7035930441183414558/detail?use_ssr=1职位描述
团队介绍:批式计算团队负责字节跳动离线数据处理&分布式训练,支撑公司内离线 ETL&机器学习等业务场景,涉及的组件包括离线计算引擎 Spark/自研分布式训练框架 Primus/特征存储 Feature Store(如 Iceberg/Hudi)/Ray 等。面对字节超大规模的场景,在 Spark/Primus/Feature Store 等方面都做了大量的功能&性能优化,同时支持新一代分布式应用框架 Ray 在公司相关场景的落地。
1 、负责 Ray 内核研发&基础设施建设,如 GCS HA/资源隔离 /K8S 等;
2 、深入理解业务,支持内部 Ray 的业务场景,包括图学习 /机器学习训练等。
职位要求
1 、具备扎实的计算机基础和数据结构与算法功底;
2 、精通 C++编程语言;
3 、具备大规模分布式系统的研发和优化能力;
4 、具有独立解决问题的能力,良好的团队合作精神。
加分项:
1 、对 Ray 有深入研究或者实践经验;
2 、对 Hadoop MapReduce/Spark/Flink 等开源计算框架有深入研究或有实践经验;
3 、对 TensorFlow/PyTorch/MXNet 等开源深度学习框架有深入研究或有实践经验。