IT人力外包人才简历库

返回列表

计算机视觉算法工程师

驻场外包人员
工作年限:11年 意向城市:杭州 浏览:3次 发布时间:近期

技能标签

Python PostGIS PostgreSQL PyTorch NumPy HuggingFace 计算机视觉 深度学习 Transformer OCR 自然语言处理 空间数据库 模型调优 分布式训练 知识蒸馏

专业技能

精通Python编程语言及深度学习框架(PyTorch/TensorFlow),熟练掌握PostGIS空间数据库与PostgreSQL关系型数据库。具备完整CV算法开发能力,包括传统图像处理(SIFT/HOG特征提取)、目标检测(YOLO/SSD)、图像分割(U-Net)等。熟悉Transformer架构大模型调优,具备NLP领域迁移学习能力。熟练使用HuggingFace进行预训练模型微调,精通NumPy科学计算库。熟悉分布式训练框架(Horovod/DistributedDataParallel)及模型压缩技术(知识蒸馏/量化)。

工作履历(脱敏处理)

长期从事计算机视觉算法研发工作,主导车载导航系统地理数据编译项目,设计基于PostGIS的空间索引优化方案,提升数据处理效率30%。主导OCR识别系统开发,采用改进的CRNN网络结构实现复杂场景文本识别准确率92%。主导虚拟数字人项目,构建语音到文本的Transformer模型,结合GAN技术实现面部表情生成,系统平均响应时间低于200ms。持续跟进CV领域前沿技术,主导多模态大模型在工业检测场景的落地应用。

项目经验(脱敏处理)

车载导航数据编译项目:基于PostGIS空间数据库构建地理数据处理流水线,设计多级索引优化方案提升空间查询效率。采用PostgreSQL时序扩展存储导航轨迹数据,开发并行化数据编译模块,实现数据处理吞吐量提升40%。技术挑战:海量地理数据存储与高效查询,解决方案:结合空间索引优化与列式存储技术。

OCR识别系统开发:基于改进的CRNN网络架构实现复杂场景文本识别,采用注意力机制提升小字识别准确率。构建多尺度特征融合模块,使识别准确率提升至92%。技术挑战:倾斜文本与光照变化干扰,解决方案:引入图像增强网络与多阶段识别策略。

虚拟数字人项目:设计语音到文本的Transformer模型架构,结合唇形同步算法实现语音驱动面部表情生成。开发基于GAN的虚拟形象生成系统,支持实时表情迁移。技术挑战:多模态数据对齐与实时渲染,解决方案:采用轻量化模型架构与GPU加速渲染技术,系统延迟控制在200ms以内。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

11年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接