IT人力外包人才简历库

返回列表

网络爬虫开发工程师

驻场外包人员
工作年限:3年 意向城市:北京 浏览:6次 发布时间:近期

技能标签

Python 网络请求库 爬虫框架 分布式系统 反爬虫策略 HTML解析 XML解析 数据库 Linux运维 Shell脚本 数据采集 网络协议分析 自动化测试 系统架构设计 多线程开发

专业技能

精通Python语言及Requests/urllib/aiohttp等网络请求库,熟练掌握Scrapy/PySpider等爬虫框架,具备分布式爬虫架构设计能力。熟悉网络协议分析及抓包工具(Wireshark/Fiddler),精通HTML/XML解析技术。掌握多进程/多线程编程及分布式系统开发(Celery/Redis)。熟练使用MySQL/Redis数据库进行数据存储与缓存,具备Linux系统运维及Shell脚本开发能力。熟悉反爬虫策略分析及应对方案,具备移动端应用逆向分析及自动化测试经验。

工作履历(脱敏处理)

主导大型分布式爬虫系统开发,实现日均20亿数据的高效采集与处理。设计基于Scrapy-Redis的分布式架构,通过代理IP池和请求队列优化解决反爬虫问题。开发自动化数据解析模块,采用XPath/BeautifulSoup实现复杂网页结构的精准提取。搭建Redis缓存系统提升数据处理效率,优化MySQL数据库索引结构提升查询性能。完成电商/直播平台等多领域数据采集系统,支持动态渲染页面的无头浏览器方案。持续优化爬虫调度算法,使系统资源利用率提升40%。

项目经验(脱敏处理)

主导某电商平台商品数据采集项目,设计分布式爬虫架构实现日均5亿数据抓取。采用Scrapy-Redis实现任务分发与结果聚合,通过代理IP池和请求头随机化应对反爬机制。开发动态渲染页面的无头浏览器方案,解决JavaScript渲染内容的采集难题。搭建Redis缓存系统降低数据库压力,优化MySQL索引结构使查询效率提升60%。实现直播平台弹幕数据采集系统,采用消息队列保证数据完整性,日均处理2亿条弹幕数据。开发自动化测试框架验证爬虫稳定性,确保系统在高并发场景下的可靠性。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接