IT人力外包人才简历库

返回列表

Python数据采集与分析工程师

驻场外包人员
工作年限:3年 意向城市:北京 浏览:1次 发布时间:近期

技能标签

Python开发 数据爬虫 数据清洗 数据库管理 自动化脚本 SQL报表开发 ETL工具 数据可视化 反爬策略 数据结构化

专业技能

精通Python爬虫开发,熟练使用Scrapy/BeautifulSoup框架实现多源数据采集;掌握数据清洗与ETL工具(Pandas/NumPy)处理结构化数据;熟悉MySQL/PostgreSQL数据库设计与优化,具备SQL报表开发能力;擅长自动化脚本开发(Shell/Python)实现数据处理流程自动化;具备数据可视化能力,可生成Excel/CSV格式报表及数据看板

工作履历(脱敏处理)

主导多个数据采集系统开发,涵盖金融、工业等多领域数据源。设计分布式爬虫架构,实现日均百万级数据采集,采用动态代理和请求头伪装技术突破反爬限制。开发数据清洗管道,通过Pandas/NumPy实现数据去重、格式标准化及异常值处理。构建数据仓库模型,采用MySQL集群存储结构化数据,通过SQL报表开发实现多维度数据分析。开发自动化运维脚本,监控服务器性能指标并生成可视化报告,提升系统运维效率30%以上。

项目经验(脱敏处理)

股权数据采集项目:基于Scrapy框架构建分布式爬虫系统,设计动态解析规则采集股权交易数据,采用Redis队列实现任务分发。开发数据清洗模块,通过正则表达式提取非结构化文本字段,构建标准化数据模型存入PostgreSQL数据库,最终通过SQL报表生成月度行业分析报告。

钢材网数据采集项目:设计多线程爬虫架构,实现按区域/品类/城市维度的分层数据采集。开发数据分拣算法,通过机器学习模型识别数据字段,构建三级分类体系存储至MySQL数据库,支持多维度数据查询与统计分析。

银联金融数据项目:构建反爬策略体系,采用IP代理池和请求头随机化技术突破目标网站防护。开发数据计算引擎,通过Spark进行分布式数据处理,实现交易数据的实时聚合分析,输出可视化报表供业务部门决策使用。

钉钉考勤数据项目:设计自动化采集方案,集成钉钉API实现考勤数据抓取,开发数据校验规则处理异常数据。构建数据看板系统,通过Excel模板引擎自动生成部门考勤统计报表,支持多维度数据钻取分析。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接