技能标签
专业技能
精通Python编程语言,熟悉C语言基础,具备扎实的编码能力。熟练掌握Scrapy、Selenium、Puppeteer等主流爬虫框架,能够构建分布式爬虫架构。熟悉反爬策略及应对措施,如IP代理、请求头伪装、验证码识别等。具备数据清洗、特征工程及机器学习模型构建能力,能够通过数据分析挖掘业务价值。
工作履历(脱敏处理)
主导设计并实现多套分布式爬虫系统,支持日均千万级数据采集。开发反爬策略应对方案,成功突破微博、天天基金等平台的动态验证机制。构建数据处理流水线,完成从原始数据清洗到特征工程的全流程开发。基于时间序列分析模型,准确预测疫情拐点及基金趋势变化。开发地理信息分析模块,揭示人口分布的二八定律特征。设计自动化交易系统,实现基金趋势分析与模拟交易的闭环验证。
项目经验(脱敏处理)
1. 新浪微博垃圾分类热度分析:构建分布式爬虫架构采集100万+条微博数据,采用情感分析算法识别热点关键词,发现舆情传播的巨浪式特征,输出可视化热力图揭示传播规律
2. 新冠疫情数据趋势预测:开发多线程爬虫采集全球疫情数据,运用时间序列分析模型识别疫情拐点,准确预测复发周期,为公共卫生决策提供数据支持
3. 全球人口分布分析:设计地理信息爬虫采集人口密度数据,通过空间聚类算法验证二八定律,输出区域特征分析报告,揭示人口分布的区域集中特性
4. 基金趋势分析系统:构建自动化交易模块,实现基金数据爬取、趋势预测及模拟交易,开发验证码识别模块突破反爬限制,完成基金买卖策略验证
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
8年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接