IT人力外包人才简历库

返回列表

Web爬虫开发工程师

驻场外包人员
工作年限:3年 意向城市:北京 浏览:2次 发布时间:近期

技能标签

Python Scrapy Django Redis MySQL MongoDB Linux Nginx Web开发 分布式爬虫 数据抓取 API设计 日志分析

专业技能

精通Python编程语言,掌握Requests、BeautifulSoup、Scrapy等爬虫框架及数据处理工具;熟悉Django/Flask Web开发框架,具备RESTful API设计能力;精通Redis分布式缓存系统及消息队列技术;掌握MySQL数据库优化及事务处理,熟悉MongoDB非关系型数据库应用;具备Linux系统部署与运维能力,熟悉Nginx反向代理配置;熟悉ELK日志分析体系,具备分布式系统调试经验

工作履历(脱敏处理)

主导分布式爬虫系统开发,采用Scrapy-Redis框架实现多节点分布式爬取,通过XPath解析HTML结构,处理分页请求及表单提交,构建数据缓存机制。设计MySQL数据迁移方案,实现Redis数据到关系型数据库的批量导入。开发基因检测选购系统,基于Django框架搭建后端服务,实现用户身份验证、订单管理及结果展示功能。采用Bootstrap构建响应式前端界面,通过AJAX实现异步数据交互,设计JSON数据接口供前端调用。优化系统性能,通过缓存机制提升数据访问效率,采用异步任务队列处理耗时操作。

项目经验(脱敏处理)

【分布式爬虫系统】基于Scrapy-Redis框架构建分布式爬虫架构,实现对北京市企业信用信息网的高效数据采集。采用XPath解析技术提取目标数据,通过分页请求机制处理无限滚动页面,使用FormRequest实现POST表单提交。搭建Redis分布式缓存系统,实现数据去重及任务分发,最终通过Python脚本将采集数据迁移至MySQL数据库。项目覆盖搜狐新闻、豆瓣、腾讯新闻等多平台数据采集,日均处理数据量达50万条。

【基因检测选购系统】开发基于Django的Web应用,实现用户注册登录、套餐选购、结果查询等核心功能。采用Cookie+Session机制保障用户登录状态,通过AJAX实现异步数据提交与动态加载。设计RESTful API接口供前端调用,使用JSON格式进行数据交互。构建MySQL数据库存储用户信息及检测结果,通过缓存机制优化系统响应速度,实现用户操作响应时间低于2秒。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接