IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

爬虫开发 JS逆向分析 分布式爬虫架构 反爬策略破解 异步并发处理 数据库优化 网络协议分析 动态加密解密 Selenium自动化 代理IP调度 数据清洗 分布式任务调度 日志监控系统 高并发处理 数据存储优化

专业技能

精通分布式爬虫架构设计与开发,熟练掌握Scrapy框架及异步并发处理技术,具备复杂反爬策略破解能力(JS逆向分析、Fiddler抓包、动态加密解密)。精通MySQL、MongoDB、Redis等多类型数据库的高并发数据处理与存储方案,熟悉Selenium自动化工具及代理IP调度系统。掌握网络协议分析与请求拦截技术,具备完整的数据采集-处理-存储全链路开发能力。

工作履历(脱敏处理)

主导数据采集系统开发,设计分布式爬虫架构实现多源数据高效采集,采用异步并发处理技术提升爬取效率300%。成功破解网易云音乐JS逆向加密方案,实现歌曲资源精准获取;攻克中大网校多层反爬机制,完成课程目录及题库数据完整采集。搭建代理IP调度系统实现IP资源动态分配,设计日志监控体系保障采集任务稳定性。优化数据库存储方案,通过索引优化与分表策略提升数据处理效率,支撑日均百万级数据吞吐量。

项目经验(脱敏处理)

网易云音乐数据采集:通过JS逆向分析破解动态加密算法,构建完整的请求拦截与数据解析流程,实现歌曲资源精准获取。采用分布式爬虫架构提升采集效率,设计代理IP调度系统应对反爬策略,最终完成百万级歌曲资源采集。中大网校数据采集:基于Scrapy框架构建多层爬取体系,攻克复杂反爬机制实现课程目录及题库数据完整采集。通过动态IP代理与请求头伪装技术突破反爬限制,建立数据清洗与存储优化方案,最终完成20万+条教育数据采集。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接