IT人力外包人才简历库

返回列表

语音识别算法工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python Shell C语言 Kaldi ESPnet Wenet Huggingface PyTorch Transformer BERT DNN RNN Conformer K-means EM

专业技能

精通Python/Shell/C语言,熟悉Kaldi/ESPnet/Wenet/Huggingface/Wav2vec等语音识别框架,掌握PyTorch深度学习框架,精通DNN/RNN/Transformer/Conformer/BERT等神经网络模型,熟练应用K-means/EM等聚类算法,具备完整的语音识别系统开发能力(数据预处理/特征提取/语言模型构建/声学模型构建/模型解码与优化)

工作履历(脱敏处理)

主导小语种语音识别系统开发,完成多语言数据预处理、特征提取及模型训练。构建70万词量4-gram语言模型,实现ASR系统困惑度190,OOV率降至最低。开发基于Transformer和BERT的标点恢复模型,通过多线程训练提升模型效果。搭建端到端语音识别系统,完成声学模型训练与优化,采用CTC/Greedy Search/Prefix Beam Search等算法提升解码性能。实现模型格式转换(PyTorch→ONNX),支持引擎部署。

项目经验(脱敏处理)

小语种语音识别标点恢复:构建基于Transformer的分类模型,采用BPE算法处理6.5GB文本数据,生成70万词量词典。训练12层Transformer模型实现F1 score提升,通过BERT微调优化语义理解。小语种ASR系统开发:完成7.5万条维语文本生成,构建6.5GB训练数据集和5小时测试集。训练15个语言模型,最终生成4-gram模型困惑度190,OOV率最低。多任务学习语音识别系统:对比GMM/DNN-HMM/CTC/Attention等模型,验证端到端模型在低资源语言场景下的性能表现。声学模型优化:融合50小时TTS数据训练Conformer模型,采用编辑距离算法二次评分提升识别效果。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接