IT人力外包人才简历库

返回列表

数据采集与爬虫开发工程师

驻场外包人员
工作年限:2年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 Scrapy框架 分布式爬虫 反爬虫策略 数据库操作 Linux系统 网络请求 数据解析 数据清洗 并发编程 API接口 数据存储 自动化脚本 性能优化 版本控制 数据可视化

专业技能

精通Python核心语言特性与高级编程技巧,包括但不限于数据类型管理、函数式编程、装饰器应用及并发编程。熟练掌握网络请求库(requests)、解析库(BeautifulSoup)、爬虫框架(Scrapy)及分布式爬虫组件(Scrapy-Redis)。具备反爬虫策略应对能力,包括代理IP配置、User-Agent伪装及请求头定制。精通MySQL与MongoDB数据库操作,熟悉连接池优化及数据存储方案。掌握Linux系统环境搭建、常用命令及性能调优。具备机器学习(scikit-learn)与数据处理(numpy/scipy/pandas)能力。

工作履历(脱敏处理)

主导开发多个数据采集项目,包括基于Selenium的票务系统自动化工具、分布式爬虫系统搭建及短视频平台数据采集方案。设计并实现反爬虫策略,成功突破目标网站的验证码识别与IP封锁机制。采用Scrapy-Redis实现百万级数据的分布式采集,通过连接池优化提升数据库操作效率30%。开发标准化数据处理流程,利用Pandas进行数据清洗与特征工程,构建可视化分析报告。具备完整的开发文档体系,能够快速响应业务需求变更。

项目经验(脱敏处理)

1. 某票务平台自动化采集系统:基于Selenium开发抢票系统,采用动态代理IP池与随机User-Agent策略应对反爬虫机制,实现每分钟100+请求的稳定采集。2. 分布式爬虫平台建设:基于Scrapy-Redis搭建分布式架构,支持多节点协同采集,日均处理数据量达500万条。3. 短视频平台数据采集:开发快手视频信息采集系统,通过模拟浏览器行为突破反爬限制,实现视频元数据与评论信息的批量存储。4. 数据处理与分析:使用Pandas进行数据清洗与特征提取,构建可视化分析模型,为业务决策提供数据支持。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

2年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接