IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python Scrapy 数据清洗 数据库优化 Linux系统 网络协议分析 反爬虫策略 ETL处理 分布式爬虫 数据存储

专业技能

精通Python编程语言,熟练掌握Scrapy、BeautifulSoup等爬虫框架,具备数据清洗与ETL处理能力,熟悉MySQL数据库优化与存储方案,了解Linux系统运维及网络协议分析,具备反爬虫策略制定与突破能力

工作履历(脱敏处理)

专注于数据采集系统开发与维护,主导设计并实现分布式爬虫架构,提升数据采集效率300%。优化数据清洗流程,降低数据冗余度40%。制定反爬虫策略,成功突破目标网站动态渲染反爬机制。搭建MySQL数据库存储方案,实现日均千万级数据存储与查询优化。持续优化网络协议分析能力,提升爬虫稳定性与数据准确性。

项目经验(脱敏处理)

1. 搭建企业级数据采集平台,采用Scrapy-Redis实现分布式爬虫架构,日均采集数据量达500万条,系统稳定性提升至99.9%。

2. 开发动态网页数据采集方案,通过Selenium+Playwright实现JavaScript渲染页面抓取,成功突破目标网站的反爬虫机制。

3. 设计数据清洗与存储方案,使用Pandas进行数据去重与格式标准化,最终数据准确率达99.8%,存储效率提升60%。

4. 优化MySQL数据库架构,通过索引优化与分库分表方案,实现千万级数据秒级查询响应,数据库资源占用降低40%。

5. 制定网络协议分析策略,通过抓包分析与请求重放技术,解决目标网站的IP封禁问题,提升爬虫可用性30%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接