IT人力外包人才简历库

返回列表

Python爬虫开发工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python Scrapy Redis MySQL MongoDB Linux 分布式爬虫 数据清洗 网络请求 异步编程

专业技能

精通Python基础语法及数据类型操作,熟练掌握函数式编程(匿名函数、装饰器)、列表推导式等高级特性。熟悉网络请求库requests、HTML解析库BeautifulSoup及Scrapy分布式爬虫框架,具备代理IP/UA伪装、分布式爬虫调度、数据存储(MySQL/MongoDB)等全栈开发能力。掌握数据库连接池优化技术,熟悉Linux系统命令及性能调优,具备日志分析及监控能力。

工作履历(脱敏处理)

主导爬虫系统架构设计,实现增量爬取、断点续爬及去重机制,通过URL状态管理优化爬虫效率。开发分布式爬虫框架,集成Scrapy-Redis实现任务分发与结果聚合。设计数据库连接池方案,提升MySQL/MongoDB读写性能30%。搭建Linux环境监控体系,实现爬虫日志分析与异常预警。优化协程爬虫架构,采用asyncio/aiohttp库提升网络请求效率。

项目经验(脱敏处理)

构建分布式爬虫系统,采用Scrapy-Redis实现任务分发与结果聚合,通过Redis队列管理爬取进度。设计URL去重策略,利用布隆过滤器降低内存消耗,实现百万级URL高效管理。开发断点续爬机制,记录爬取状态并支持任务恢复。优化协程爬虫架构,采用asyncio/aiohttp库实现异步网络请求,提升爬取速度3倍。完成B站视频数据采集项目,解析HTML结构,处理反爬机制,实现数据清洗与存储。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接