IT人力外包人才简历库

返回列表

高级网络数据工程师

驻场外包人员
工作年限:5年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 分布式爬虫 数据解析 反爬虫策略 网络协议分析 API开发 数据清洗 ETL处理 动态网页逆向 高并发系统 数据存储 请求模拟 加密参数解密 网络请求分析 数据采集框架

专业技能

精通Python编程语言及主流爬虫框架(Scrapy、Requests、Playwright),掌握分布式爬虫架构设计与部署(Scrapy-Redis、Apache Kafka),熟练运用正则表达式、XPath、BeautifulSoup等数据解析技术。熟悉网络协议(HTTP/HTTPS、WebSocket)、反爬虫策略(IP代理、User-Agent伪装、请求头定制)、数据清洗与ETL处理。具备大规模数据存储能力(MySQL、MongoDB、Elasticsearch),擅长构建高并发数据采集系统。精通网络请求模拟(Selenium、Puppeteer)、动态网页逆向分析(JavaScript反编译、加密参数解密)及API接口开发(Django REST Framework、FastAPI)。

工作履历(脱敏处理)

专注于网络数据采集系统开发与优化,主导设计并实现分布式爬虫架构,支持千万级URL调度与并发处理。开发动态网页逆向分析工具,成功破解主流社交平台(微博、抖音、小红书等)的加密参数机制。构建基于Kafka的消息队列系统,实现数据采集与存储的解耦。优化数据清洗流程,提升数据处理效率30%。开发标准化数据采集框架,支持快速接入新平台,降低项目开发周期50%。主导设计API接口规范,实现采集数据的结构化输出与多端调用。

项目经验(脱敏处理)

主导主流社交平台数据采集系统开发,采用分布式爬虫架构(Scrapy-Redis)实现千万级数据抓取,通过动态网页逆向分析破解加密参数机制,设计反反爬虫策略(IP代理池、请求头随机化)。开发实时数据采集接口,基于Kafka实现数据缓冲与异步处理,构建数据清洗管道提升数据质量。设计模块化采集框架,支持快速接入新平台,实现采集规则配置化管理。优化网络请求模拟方案,采用Playwright替代Selenium提升采集效率,解决动态渲染页面数据抓取难题。建立数据存储体系(MySQL+MongoDB),实现结构化数据存储与检索,支撑后续数据分析与可视化应用。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

5年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接