IT人力外包人才简历库

返回列表

数据采集系统架构师

驻场外包人员
工作年限:12年 意向城市:上海 浏览:1次 发布时间:近期

技能标签

Scrapy Puppeteer 分布式爬虫 反爬虫策略 数据清洗 ETL流程 IP代理 字库加密 JS解密 动态渲染 爬虫架构设计 数据采集系统 请求头伪装 分布式任务调度 数据存储优化

专业技能

精通Scrapy分布式爬虫框架与Puppeteer无头浏览器技术,擅长构建高并发数据采集系统。具备完整的数据采集-清洗-入库开发经验,精通IP代理池管理、字库加密解密、动态页面解析及JS加密反编译技术。熟悉分布式爬虫架构设计,具备反爬虫策略制定与攻防对抗经验,擅长构建可扩展的数据采集平台。

工作履历(脱敏处理)

主导设计并实现多套分布式数据采集系统,涵盖网页爬虫、API接口采集及动态渲染数据抓取。开发IP代理池管理系统,实现请求头动态伪装与反爬虫策略自动切换。构建数据清洗ETL流程,提升数据处理效率300%。设计动态页面解析方案,成功突破目标网站的JS加密反爬机制。主导开发数据存储优化方案,实现千万级数据的高效入库与查询。持续优化爬虫任务调度算法,提升系统吞吐量与资源利用率。

项目经验(脱敏处理)

1. 某知名互联网平台全量数据采集项目:基于Scrapy-Redis构建分布式爬虫架构,采用多级代理和请求头伪装技术突破反爬机制,成功采集平台全量数据并建立结构化数据库。

2. 某国际社交平台联系人数据采集项目:运用Puppeteer无头浏览器技术处理动态渲染页面,开发分布式任务调度系统,实现千万级联系人数据的高效采集与存储。

3. 某创投数据平台新闻采集项目:设计多线程爬虫架构,实现对多个新闻源的动态内容解析,构建分类标签体系,完成千万级新闻数据的清洗入库与可视化分析。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

12年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接