IT人力外包人才简历库

返回列表

Python爬虫开发工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 Scrapy框架 Selenium自动化 反爬策略 数据清洗 分布式爬虫 网络协议分析 数据可视化 Linux运维 数据库存储

专业技能

精通Python编程语言,熟练掌握Scrapy分布式爬虫框架(支持中间件处理、请求调度、数据管道),擅长使用Selenium进行动态网页数据抓取(支持ChromeDriver自动化操作)。熟悉网络爬虫原理与反爬策略,能够通过代理IP池、请求头伪装、验证码识别等技术应对反爬机制。掌握Pandas/Numpy进行数据清洗、特征工程与统计分析,具备数据可视化能力。熟悉Linux环境部署与日志分析,了解MongoDB/MySQL数据存储方案。

工作履历(脱敏处理)

作为核心开发人员参与某大型央企数据采集项目,主导构建基于Scrapy-Redis的分布式爬虫系统,实现日均百万级数据采集。设计Selenium自动化方案应对动态渲染页面,通过ChromeDriver实现JavaScript内容解析。开发数据清洗模块,使用Pandas完成数据去重、特征提取与统计分析。搭建MySQL数据存储架构,实现数据分表存储与查询优化。通过代理IP池技术提升爬虫稳定性,使系统可用率达98%以上。

项目经验(脱敏处理)

主导某大型央企数据采集项目,基于Scrapy框架构建分布式爬虫系统,攻克动态网页反爬技术难题。采用Selenium实现ChromeDriver自动化操作,处理JavaScript渲染内容。设计数据清洗模块,使用Pandas完成数据去重、特征工程与统计分析。搭建MySQL分库分表存储架构,实现数据高效存取。通过代理IP池技术提升爬虫稳定性,使系统日均处理数据量达200万条,数据准确率保持99.5%以上。优化请求调度策略,使爬虫系统吞吐量提升300%,成功完成100+目标网站数据采集任务。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接