技能标签
专业技能
精通Python/Shell/C语言,熟悉Kaldi/ESPnet/Wenet/Huggingface/Wav2vec等语音识别框架,掌握PyTorch深度学习框架,精通DNN/RNN/Transformer/Conformer/BERT等神经网络模型,熟练应用K-means/EM等聚类算法,具备完整的语音识别系统开发能力(数据预处理/特征提取/语言模型构建/声学模型构建/模型解码与优化)
工作履历(脱敏处理)
主导小语种语音识别系统开发,完成多语言数据预处理、特征提取及模型训练。构建70万词量4-gram语言模型,实现ASR系统困惑度190,OOV率降至最低。开发基于Transformer和BERT的标点恢复模型,通过多线程训练提升模型效果。搭建端到端语音识别系统,完成声学模型训练与优化,采用CTC/Greedy Search/Prefix Beam Search等算法提升解码性能。实现模型格式转换(PyTorch→ONNX),支持引擎部署。
项目经验(脱敏处理)
小语种语音识别标点恢复:构建基于Transformer的分类模型,采用BPE算法处理6.5GB文本数据,生成70万词量词典。训练12层Transformer模型实现F1 score提升,通过BERT微调优化语义理解。小语种ASR系统开发:完成7.5万条维语文本生成,构建6.5GB训练数据集和5小时测试集。训练15个语言模型,最终生成4-gram模型困惑度190,OOV率最低。多任务学习语音识别系统:对比GMM/DNN-HMM/CTC/Attention等模型,验证端到端模型在低资源语言场景下的性能表现。声学模型优化:融合50小时TTS数据训练Conformer模型,采用编辑距离算法二次评分提升识别效果。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
1年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接