IT 桔子(
itjuzi.com )是一家聚焦创业公司、产品、投资领域的数据公司,随着数据量的不断增多、需求深入,我们在数据方面遇到了挑战—— 包括 抓取更多的数据并程序化清洗、匹配、入库;对多个数据渠道进行交叉验证、整合;数据的结构化、可视化处理;数据建模与指数算法等~~
所以,我们希望找寻靠谱的 数据爬虫与挖掘工程师,一起升级打怪:
岗位职责:
1.负责设计和开发网络爬虫系统,进行多平台信息的抓取和分析工作;
2.负责网页信息和 APP 数据抽取、清洗、消重等工作,提升平台的抓取效率;
3.参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4.实时监控爬虫的进度和警报反馈;
任职要求:
1.熟悉 Linux 系统,掌握 Python ;
2.了解多线程、多进程、网络通信编程相关知识,有数据挖掘经验;
3.掌握网页抓取原理及技术,了解基于 Cookie 的登录原理,熟悉基于正则表达式、 XPath 、 CSS 等网页信息抽取技术;
4.熟悉 APP 模拟及接口验签破解技术,了解 APP 用户授权访问机制,掌握 Selenium , APP 破解技术优先;
5.做过数据处理、 ETL 等相关工作优先。
薪酬: 15-25K/月
欢迎大家和我联系:
[email protected]
O(∩_∩)O 谢谢。