IT人力外包人才简历库

返回列表

数据采集与爬虫开发工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:4次 发布时间:近期

技能标签

Python Scrapy Selenium Requests 反爬虫 Redis MySQL Django 并发编程 Linux 数据分析 Git HTML/CSS JavaScript RESTful

专业技能

精通Python编程语言,熟悉设计模式(工厂模式、单例模式、装饰器模式),掌握HTML/CSS网页解析技术,具备JavaScript及jQuery动态内容处理能力。熟练使用Scrapy、Selenium、Requests等爬虫框架,精通反爬虫策略(IP代理、请求头伪装、验证码识别)及反反爬技术(动态渲染、分布式爬虫架构)。熟悉Django、Flask、Tornado等Web开发框架,掌握RESTful API设计规范。精通MySQL数据库优化与Redis缓存集群部署,具备Linux系统运维能力(Shell脚本、进程管理、日志分析)。熟悉数据清洗、ETL流程及可视化分析工具。

工作履历(脱敏处理)

参与某大型电商平台商品数据采集系统开发,主导反爬虫策略设计与分布式爬虫架构搭建,实现日均百万级数据采集。完成用户注册登录系统开发,基于Django框架实现JWT认证机制,并集成第三方短信验证服务。开发坦克大战小游戏,展示面向对象编程及游戏引擎开发能力。主导多线程/异步协程并发编程实践,优化数据采集效率300%。完成数据清洗、存储及可视化分析模块,建立MySQL数据库索引优化方案,提升查询效率40%。

项目经验(脱敏处理)

电商平台商品数据采集系统:采用Scrapy-Redis实现分布式爬虫架构,通过IP代理池、请求头伪装及验证码识别技术突破反爬限制,日均采集商品数据超百万条。完成数据清洗、存储及可视化分析模块,建立MySQL数据库索引优化方案,提升查询效率40%。

电商数据采集项目:开发淘宝、京东等电商平台商品数据采集系统,使用Selenium处理动态渲染页面,结合Requests实现API接口数据抓取,构建反反爬策略体系,数据准确率达99.8%。

电影数据采集系统:基于Scrapy框架采集猫眼电影数据,通过分布式爬虫架构实现高并发采集,数据清洗后存储至MySQL数据库,支持多维度数据分析。

小说数据采集项目:开发纵横小说网站书籍数据采集系统,采用异步协程技术提升采集效率,实现章节内容结构化存储,支持数据可视化展示。

个人项目:坦克大战小游戏开发,运用面向对象编程思想实现坦克、子弹、墙壁等游戏元素,集成音效及爆炸效果,展示游戏开发及算法实现能力。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接