IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

JS逆向分析 Scrapy框架 动态加密参数逆向分析 Chrome开发者工具调试 XPath数据解析 MySQL数据库 MongoDB存储 分布式爬虫架构 网络请求拦截 加密算法还原 数据采集合规性 请求频率控制 反爬虫策略 数据清洗 爬虫中间件开发

专业技能

精通网络爬虫技术体系,熟练掌握Scrapy框架开发全流程。具备动态加密参数逆向分析能力,可独立完成JS混淆代码解析、加密算法还原及Python代码重构。熟悉Chrome开发者工具调试技术,擅长通过Sources面板定位加密函数并构建逆向分析模型。掌握MySQL/MongoDB数据存储方案,熟悉XPath/CSS选择器数据解析技术。具备分布式爬虫架构设计能力,可实现高并发数据采集与流量控制。

工作履历(脱敏处理)

专注于网络数据采集系统开发,主导Scrapy爬虫架构设计与实现。成功突破JS加密网站的数据采集壁垒,通过Chrome开发者工具定位加密函数,完成MD5算法还原及Python代码重构。开发动态加密参数生成模块,实现请求头动态注入加密参数。构建分布式爬虫架构,优化请求频率控制策略,提升采集效率30%以上。设计数据存储方案,实现采集数据的MySQL/MongoDB异构存储。开发翻页逻辑处理模块,解决动态加载分页问题,保障数据完整性。

项目经验(脱敏处理)

1. 开发智能翻页采集系统:通过分析网站分页参数逻辑,构建动态翻页请求处理模块。采用Scrapy中间件实现分页参数动态注入,解决动态加载分页问题,成功采集100+页面数据。 2. 构建JS加密参数逆向系统:运用Chrome开发者工具定位加密函数,完成MD5算法还原及Python代码重构。在Scrapy中间件中集成动态参数生成逻辑,实现加密参数自动注入,突破网站反爬虫策略。 3. 设计数据存储优化方案:根据数据特征选择MySQL/MongoDB存储方案,设计数据清洗规则,提升数据存储效率。通过XPath/CSS选择器解析目标字段,实现数据结构化存储。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接