IT人力外包人才简历库

返回列表

数据采集开发工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 爬虫开发 反爬策略 Selenium自动化 数据清洗 Excel处理 定时任务 异常处理 分布式框架 请求头配置 代理IP管理 网络优化 多线程编程 数据结构化 爬虫调度

专业技能

精通Python爬虫开发,擅长构建分布式爬虫框架,掌握反反爬策略设计与实施。熟练使用Selenium进行动态页面数据提取,具备复杂反爬机制(如IP封禁、验证码识别)的攻防能力。精通数据清洗与结构化处理,熟悉使用Pandas、Openpyxl实现Excel数据交互。掌握定时任务调度框架BlockingScheduler,具备多线程/异步编程能力。熟悉网络请求优化技术,包括请求头配置、代理IP池管理、请求频率控制等。精通异常处理机制,可应对网站结构变更、分页解析兼容性等技术挑战。

工作履历(脱敏处理)

专注于数据采集系统的开发与优化,主导设计并实现多套分布式爬虫架构,提升数据采集效率300%。开发反反爬策略系统,成功突破10+网站的复杂反爬机制,包括动态验证码识别和IP封禁绕过。构建数据清洗流水线,实现日均百万级数据的结构化处理。优化定时任务调度系统,支持多周期数据回溯与增量更新。开发IP代理管理系统,实现动态IP池的自动切换与负载均衡,提升采集稳定性。

项目经验(脱敏处理)

《数据采集平台开发》:主导搭建企业级数据采集系统,采用分布式爬虫框架实现多源数据采集。设计反反爬策略体系,通过请求头动态配置、代理IP池管理、请求频率控制等技术突破网站反爬机制,成功采集20+目标网站数据。开发数据清洗模块,使用Pandas实现数据结构化处理,日均处理数据量达150万条。构建定时任务调度系统,支持分钟级增量更新与日级全量回溯,保障数据时效性。优化Selenium自动化脚本,通过异步请求与多线程处理提升采集效率,系统稳定运行周期达90天。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接