IT人力外包人才简历库

返回列表

数据采集与爬虫开发工程师

驻场外包人员
工作年限:2年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python 爬虫开发 Selenium XPath 正则表达式 MySQL Oracle Git Maven Linux Redis FastDFS Shell脚本 分布式爬虫 数据清洗

专业技能

精通Python爬虫框架开发,擅长使用Selenium、BeautifulSoup、XPath及正则表达式进行网页解析。熟练掌握MySQL、Oracle等关系型数据库设计与优化,具备复杂SQL语句编写能力。精通Git版本控制及Maven项目构建,熟悉Linux系统运维及Shell脚本开发。掌握Redis分布式缓存技术,了解FastDFS分布式文件存储系统,具备日志分析与性能调优经验。

工作履历(脱敏处理)

主导某电商平台数据采集系统开发,设计分布式爬虫框架实现日均百万级商品数据抓取,采用Redis缓存优化请求频率,通过动态代理池解决IP封禁问题。参与某金融数据爬虫平台建设,开发基于Selenium的动态页面解析模块,实现复杂表单数据自动填充与验证。优化MySQL数据库索引结构,将数据导入效率提升60%。设计Shell脚本自动化监控系统,实现爬虫任务状态实时追踪与异常告警。

项目经验(脱敏处理)

【电商平台数据采集系统】

基于Scrapy框架构建分布式爬虫系统,采用Redis队列实现任务分发,通过Selenium处理JavaScript渲染页面,使用XPath和正则表达式提取结构化数据。解决反爬机制问题,开发动态IP代理池和请求头随机化策略,日均采集商品数据超100万条,数据准确率达99.8%。

【金融数据爬虫平台】

设计微服务架构的爬虫系统,使用Spring Boot实现数据采集模块,通过XPath解析复杂HTML结构,结合正则表达式提取非结构化文本数据。开发数据清洗管道,使用PySpark进行分布式数据处理,最终实现日均50万条金融数据的自动化采集与存储,系统可用性达99.9%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

2年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接