IT人力外包人才简历库

返回列表

数据采集与分析工程师

驻场外包人员
工作年限:8年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python开发 Scrapy框架 Selenium自动化 分布式爬虫 反爬策略 数据清洗 NLP技术 时间序列分析 网络协议分析 数据可视化

专业技能

精通Python编程语言,掌握Scrapy、Selenium、Puppeteer等主流爬虫框架,熟悉分布式爬虫架构设计。具备网络协议分析能力,熟练使用正则表达式、XPath、CSS选择器进行数据提取。精通数据清洗与预处理技术,熟悉Pandas、NumPy等数据处理工具。掌握反爬策略识别与应对技术,包括IP代理、请求头伪装、验证码识别等。具备大数据分析能力,熟悉时间序列分析、自然语言处理及可视化工具。

工作履历(脱敏处理)

主导设计并实现多套分布式爬虫系统,日均采集数据量超500万条,构建完整的数据清洗、存储与分析流程。开发反爬策略识别模块,成功突破目标网站的IP封禁、验证码识别等防护机制。运用时间序列分析方法,完成疫情数据趋势预测模型构建,准确率超过85%。设计舆情分析系统,通过自然语言处理技术提取社交媒体话题关键词,支持热点事件实时监控。

项目经验(脱敏处理)

1. 新媒体舆情分析系统:基于Scrapy-Redis构建分布式爬虫框架,日均采集微博数据50万条,通过情感分析模型识别垃圾分类话题的热度峰值,发现传播规律符合巨浪式分布特征。2. 疫情数据监测平台:开发反爬策略识别模块,成功获取全国疫情数据,利用时间序列分析预测疫情拐点,准确识别3次疫情复发特征。3. 人口分布研究项目:设计空间数据分析模型,验证人口分布符合二八定律,揭示区域人口密度差异特征。4. 基金趋势分析系统:实现模拟登录绕过反爬机制,完成基金数据采集与趋势预测,开发自动买卖策略模块。5. 多源数据整合平台:构建统一数据处理管道,整合豆瓣、天气、基金等多源数据,建立行业工资分布分析模型。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

8年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接