IT人力外包人才简历库

返回列表

数据采集与分析工程师

驻场外包人员
工作年限:1年 意向城市:北京 浏览:3次 发布时间:近期

技能标签

Python Scrapy MySQL 正则表达式 XPath HTTP协议 数据清洗 分布式爬虫 Redis 数据采集

专业技能

精通Python编程语言,熟练使用Pandas/NumPy进行数据处理与分析。掌握MySQL数据库设计与优化,熟悉索引策略与查询优化。具备Scrapy框架开发经验,能够实现分布式爬虫架构。熟练运用正则表达式、XPath进行网页数据解析,深入理解HTTP/HTTPS协议及请求头构造。熟悉数据清洗、ETL流程及存储方案设计。

工作履历(脱敏处理)

专注于数据采集与分析领域,主导搭建基于Scrapy的分布式爬虫系统,实现日均百万级数据采集。设计MySQL数据库分库分表方案,通过索引优化使查询效率提升40%。开发数据清洗ETL流程,建立标准化数据质量校验机制。参与反爬虫策略分析,通过代理IP池和请求头伪装技术突破限制。持续优化爬虫任务调度,采用Redis队列实现任务分发与负载均衡。

项目经验(脱敏处理)

基于Scrapy框架构建分布式爬虫系统,日均采集百万级数据。针对目标网站反爬虫机制,设计代理IP池和请求头伪装方案,成功突破动态验证码识别限制。采用Redis队列实现任务分发,通过分布式存储优化数据处理效率。开发数据清洗ETL流程,建立数据质量校验机制,使数据可用率提升至98%。设计MySQL分库分表方案,通过索引优化使复杂查询响应时间缩短60%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接