技能标签
专业技能
精通大模型训练方法论,包括预训练(Pre-training)、监督微调(SFT)、基于人类反馈的强化学习(RLHF)等核心算法。熟练掌握DeepSeek、Qwen、ChatGLM等主流大模型架构,具备模型推理服务框架(Sglang、vLLM)的开发经验。精通RAG(Retrieval-Augmented Generation)技术体系,包括GraphRAG、LightRAG等检索增强生成方案。熟悉MCP多端服务编排与异步任务调度系统,具备分布式AI服务开发能力。掌握Dify低代码AI开发平台,具备Workflow设计与AI工具定制经验。熟悉数字人技术栈(ASR、TTS、Wav2Lip)及Prompt工程优化。精通Transformer、BERT、GPT等深度学习模型,熟悉PyTorch/TensorFlow框架。熟练使用MySQL、Redis、Neo4j等数据库,掌握Milvus、Chroma等向量数据库技术。具备Linux环境开发及Docker容器化部署能力。
工作履历(脱敏处理)
主导开发基于RAG技术的智能问答系统,通过MinerU工具与Glm4v-9b模型实现文档语义块提取,采用bge-m3嵌入模型构建Milvus向量数据库,支持高效语义检索。设计多模型协同推理架构,整合Qwen2.5-32b模型进行上下文重排序与答案生成,通过Redis缓存优化系统响应速度。解决用户查询代词消解、查询重写等技术难点,实现系统吞吐量提升40%,降低人工问答成本60%。开发数字人语音交互模块,集成ASR/TTS技术实现自然语言对话,支持Wav2Lip视频生成,提升人机交互体验。
项目经验(脱敏处理)
项目背景:构建智能问答系统以提升企业文档检索效率。项目流程:1.采用MinerU工具与Glm4v-9b模型进行文本、表格及标题的语义块提取。2.基于bge-m3嵌入模型构建Milvus向量数据库,实现文档向量化存储与高效语义检索。3.设计查询重写模块,处理代词消解与子问题生成,确保检索准确性。4.通过Milvus并行检索获取Top3相关上下文,利用Qwen2.5-32b模型进行上下文融合与答案生成。5.基于Redis缓存用户对话历史,支持快速响应与代词消解。6.优化系统架构,实现日均10万+次查询的高并发处理能力。技术挑战:多模型协同推理的上下文一致性、向量检索的实时性保障、复杂查询的意图识别。解决方案:采用异步任务调度优化资源利用率,设计动态权重的重排序算法,结合Prompt工程提升模型理解能力。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
3年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接