IT人力外包人才简历库

返回列表

Python数据采集工程师

驻场外包人员
工作年限:3年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 Web爬虫 反爬虫技术 数据采集 Redis MongoDB MySQL Selenium Requests OCR识别 网络协议分析 数据清洗 分布式爬虫 自动化测试 API接口调试

专业技能

精通Python编程语言,熟练掌握Web爬虫技术栈(Selenium/Requests/Parsel),熟悉分布式爬虫框架(Scrapy),擅长处理反爬虫机制(Pytesseract/百度智能云/超级鹰OCR)。熟练使用Redis、MongoDB及MySQL进行数据存储与管理,具备数据清洗与结构化处理能力。熟悉网络协议分析(Fiddler),能够实现自动化数据采集与解析。

工作履历(脱敏处理)

主要负责企业级数据采集系统的开发与维护,主导设计分布式爬虫架构,提升数据采集效率30%。开发反爬虫解决方案,成功突破目标平台的验证码识别与IP封禁机制。搭建自动化数据处理流水线,实现日均百万级数据清洗与存储。优化数据库查询性能,将数据检索响应时间缩短至200ms以内。持续维护并升级爬虫框架,适配新业务需求。

项目经验(脱敏处理)

某电商平台数据采集项目:设计基于Selenium的自动化爬虫系统,攻克动态渲染页面的反爬虫机制,采用Pytesseract结合百度智能云实现验证码识别。开发分布式爬虫框架,通过Redis队列实现任务分发,日均处理数据量达50万条。优化数据存储方案,采用MongoDB分片技术提升写入性能,同时设计数据清洗规则,确保数据质量符合业务需求。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接