# LLM_Interview **Repository Path**: Mark--Zhang/llm_interview ## Basic Information - **Project Name**: LLM_Interview - **Description**: 大模型相关实习知识总结 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-25 - **Last Updated**: 2026-02-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # LLM_Interview #### 介绍 大模型相关实习知识总结 ## 岗位介绍 职务描述 1、在菜鸟物流科技面向行业客户的商业化场景中,灵活运用机器学习与深度学习技术,为销量预测、用户画像、广告营销、用户增长、智能语音以及多种数智化算法服务提供支持,助力各行业实现智能化决策; 2、深入探索大语言模型的应用,通过大语言模型的本地化部署、LLM微调、RAG、prompt engineering、 REACT等技术,为客户提供定制化的大模型解决方案,推动生成式AI在各行业的高效落地,助力提升行业运行效率与智能化水平; 3、围绕业务场景深入研究和开发基于大模型驱动的智能Agent系统,包括但不限于多Agent协作、Agent自治决策链路、任务分解与调度、知识注入、复杂对话管理和自监督任务学习等。 职位要求 1、具备扎实的数学和统计学理论功底,熟悉常见算法与数据结构,精通深度学习算法及其主流框架。具备将算法从理论转化为实际应用的能力,能够快速结合业务场景设计并实现技术解决方案; 2、出色的沟通表达能力,具备敏锐的业务思维和严谨的逻辑思维,能够高效进行跨团队协作; 3、熟练掌握主流开源机器学习库和深度学习平台,如TensorFlow、Keras、PyTorch、MXNet、scikit-learn、pandas等; 4、熟悉机器学习与深度学习,有实际深度学习与机器学习落地经验的优先,包含但不限于销量预测、消费者画像、nlp算法、图像等; 5、熟悉大模型微调(LoRA/QLoRA)、PE、RAG(LightRAG/GraphRAG);具备CDM、MCP、RAG (LightRAG/GraphRAG)、REACT、多agent实战经验;精通LLM本地化部署、量化推理及优化;熟练使用HF Transformers、LangChain、LlamaIndex;加分项:多模态RAG或RLHF经验。同时具备4和5的优先。 1. 与各业务、产品、工程团队配合,在京东亿量级的数据与丰富的业务应用场景中不断进行深入的大模型算法研究和模型构建; 2. 参与到京东大模型的相关业务场景中,包括但不限于大模型对话、大模型生成式推荐、大模型生成式检索、大模型语义理解、大模型商品理解、大模型图像生成、大模型视频生成等内容; 3. 与京东的技术团队及科学家们一同参与大模型算法及应用的前沿研究,助力业务提升效率,实现京东技术愿景和战略。 任职资格 1. 统招本科及以上学历在校生,27届优先; 2. 拥有但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、数学等相关专业学习背景,熟练掌握大模型相关基础理论和算法,有大模型相关实践经验优先; 3. 至少熟悉Java、C/C++、python中的一门语言,有较强的编程能力,了解常用机器学习/深度学习框架,如:TensorFlow、Pytorch、Caffe等; 4. 拥有良好的逻辑思维能力,良好的沟通能力、团队合作精神和学习能力,充满技术热情与理想。 5. 符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。 1、负责算法应用类项目的开发,根据业务侧需求设计应用工程框架,实现智能化的应用功能; 2、负责算法应用基础设施的搭建、维护和完善,持续提升应用支撑能力; 3、紧跟大模型及Agent应用的前沿发展趋势,结合实际应用场景,提供更加优秀的解决方案。 岗位要求 1、熟悉常用的AI Agent应用开发及监控、效果评测框架,包括但不限于:LangChain、LangGraph、Langfuse、Dify等; 2、了解AIGC、大模型相关产品使用及平台部署,有模型预训练、微调、部署等工程化实施经验最佳; 3、了解 PyTorch、Triton、ONNX、TensorRT 等与ML模型定义、训练及部署相关的技术选型,有ML模型服务化部署经验最佳; 4、对行业新的技术趋势(如大模型训练、推理部署、Agent、RAG应用等),具有极强的好奇心及学习的自驱力; 5、有良好的沟通、理解和表达能力,学习能力强,文献阅读能力强,积极主动,有团队合作精神; 算法与数据挖掘相关专业同学优先。 工作职责 1、跟进大模型领域的最新进展,包括LLM、VLM、VLA、Speech LLM、Resonning、Diffusion LLM、AgenticLLM等模型领域近期算法的跟踪,以及结合实际场景进行落地的探索,行业最佳实践的流程标准化; 2、负责研究和洞察大模型评测体系和数据构建方法,建立自动评估大模型、智能体、推理的能力; 3、负责大模型的预训练、继续预训练、微调、强化学习、数据整理、推理优化等工作; 4、跟踪行业和竞品发展情况,跟踪完成AI相关特性的竞品横向洞察,牵引模型能力优化与竞争力提升。 任职要求 1、计算机科学、机器学习、人工智能、软件工程、应用数学、运筹优化、电子信息等专业方向; 2、具有良好的大语言模型学术背景和文献阅读能力,有相关竞赛获奖经历或发表相关学术论文更佳; 3、熟练掌握Python/C/C++/Java中的一种语言,熟悉一种深度学习框架,有良好的编程基础; 4、加分项:在高水平国际会议或者学术期刊发表过相关论文,或有高水平竞赛获奖经历,或者有过相关的实习经历;对强化学习、多模态领域、推理模型有一定的理解和实践经验。 1.探索超大规模多模态模型,并进行极致系统优化; 2.数据建设、指令微调、偏好对齐、模型优化; 3.将多模态大模型应用于图像/视频的生成创作、图表理解生成、逻辑推理、GUI理解等领域; 4.深入研究和探索多模态大模型在更多未来生活场景尤其是AIPC中的应用。 任职资格 1.计算机、数学、机器学习或相关专业硕士及以上学历; 2.熟练掌握Python,熟悉Linux环境开发,熟悉应用深度学习框架TensorFlow或者PyTorch; 3.熟悉spark,hive,Flink等大数据计算框架及常见的数据挖掘和机器学习工具; 4.精通大型系统的数据建设各项能力,有深刻的数据洞察力; 5.有大规模预训练LLM的数据建设经验者优先, 在数据、机器学习等相关领域的顶会议发表高质量论文者优先 职位描述 1. 负责语言大模型基座在汽车设计、生产、制造、售后、运营全生命周期场景语料的训练; 2. 负责研发知识增强大语言模型技术,包括大模型领域适配、知识对齐、知识增强等,在车企场景构建专业知识驱动的智能体应用; 3. 跟踪和研究前沿的大模型、智能体(Agent)等技术方向。 职位要求 1. 硕士及以上学历在读,计算机科学、数学或统计学相关专业背景; 2. 在自然语言理解、计算机视觉、多模态、深度学习等领域有较深入的研究,熟练使用pytorch/tensorflow等至少一种主流深度学习框架,能够独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 对LLM、多模态学习有深入理解和实践,有预训练、reasoning post-training、可控内容生成方向经验者优先; 4. 具备良好的分析和问题解决能力、优秀的工程素养,能够独立思考和解决实际问题; 5. 具备较强的团队合作能力和沟通能力,能够与工程团队、业务团队、产品团队和其他技术团队紧密配合。 职位描述 1. 设计并实现面向车载人机智能交互系统的强化学习算法及训练框架,优化多轮对话决策、任务规划等agent能力。 2. 负责调研、复现LLM agentic RL相关的前沿研究,探索将新技术应用于实际产品。 3. 协助设计并实现增强基模agent相关能力的交互环境、user simulator、world model、reward function等关键模块。 4. 协助实车数据问题挖掘、分析及解决方案制定等。 职位要求 1. 本科及以上学历,计算机、自动化、信号处理等相关专业,数理基础扎实,乐于在强化学习方向深入探索。 2. 熟练掌握Python/JAVA/TypeScript/JsonScript等编程语言(一门及以上)。 3. 熟悉LLM agent相关概念,深入理解ReAct、function call、TIR、reflection等相关范式。 4. 熟练掌握LLM RL主流算法原理,如PPO、GRPO、DAPO等,对agentic RL范式有研究兴趣,有实际项目经验为佳。 5. 熟悉常见强化学习框架,包括但不限于Verl、Slime、ms-swift、OpenRLHF、TRL等。对大规模分布式机器学习框架有一定了解,对training、inference相关infra工作感兴趣。 7. 熟悉语音对话系统,或有高水平论文发表者优先。 作为蔚来汽车整车应用软件中心算法团队的大模型应用开发实习生,你将参与构建基于大模型的智能工作流,推动大模型应用在车辆数据分析,人工提效等业务场景中的 AI Agent 落地。 工作职责: 1. 参与构建基于 RAG(Retrieval-Augmented Generation)的知识增强问答系统,服务于研发助手、智能问题分析、运维助手等智能场景; 2. 设计并搭建端到端的 LLM 应用工作流,包括文档解析、向量检索、调用链路编排、MCP、API 服务集成等; 3. 研究与实践 RAG 相关评估方法,持续优化系统效果; 4. 推进系统原型设计、接口开发和上线部署; 5. 跟踪开源生态并在项目中灵活选型、集成。 职位要求 职位要求: - 计算机、人工智能等相关专业本科及以上学历,在校期间有相关项目经验; - 每周实习4天及以上,实习时长4个月及以上 - 熟悉大语言模型基本原理,了解微调(如 LoRA)、Prompt 设计、Embedding 检索等概念; - 熟练使用 Python,有 LangGraph / LlamaIndex / FastAPI 等框架经验者优先; - 对文本解析、知识库构建、嵌入向量搜索等方向有一定理解; - 了解大模型评估方法,具备对模型回答进行客观评价的意识和能力; - 逻辑清晰,有较强的自驱力、学习能力和动手能力; - 良好的沟通能力和团队合作精神,热爱生成式 AI 与工程实践; ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI Platform 团队,隶属于产品研发和工程架构部门。面向公司内部各业务线,建设统一的AI 应用基础设施和工程平台,帮助业务高效、稳定地落地大模型应用,加速 AI 产品创新。 在平台产品侧,团队打造了新一代AgentOps平台,提供 Prompt Engineering、Agent观测、评测、数据处理、模型微调等 Agent 全生命周期解决方案,帮助Agent开发者构建效果调优的数据飞轮。产品也已成功推出商业化版本。 AI Platform 团队还持续孵化多种面向内部与外部场景的AI应用创新产品,积极探索大模型应用的技术发展。团队氛围好,发展空间大,欢迎加入! 1、参与面向AI Coding场景的研发提效项目,包括大模型、Agent效果优化等,包括模型训练、数据准备、Agent自进化、测试时计算等; 2、参与面向内部研发场景的模型训练调优,包括CT、SFT、RL以及相应的数据工程、评测工程等; 3、参与面向内部研发场景的Agent调优,包括上下文工程、测试时计算、记忆、知识库等; 4、持续跟进LLM前沿技术,参与AI相关新产品功能的设计,为团队提供前沿的知识和见解。 职位要求 1、2027届硕士及以上学位在读,计算机、人工智能、自动化、数学相关专业优先; 2、拥有AI coding相关研究经验,或拥有Agent优化、大模型训练相关实操经验者优先; 3、拥有AI领域的研究经历,特别是在大语言模型(LLMs)和生成式人工智能等方面,在顶会上发表过论文者优先,主导过业内影响力较大的项目者优先; 4、具备优秀的开发能力,熟练使用Vibe coding工具者优先。 团队介绍:飞书是 AI 时代先进生产力平台,提供一站式工作协同、组织管理、业务提效工具和深入企业场景的 AI 能力,助力企业能增长,有巧降。 从互联网、高科技、消费零售,到制造、金融、医疗健康等,各行各业先进企业都在选择飞书,与飞书共创行业最佳实践。先进团队,先用飞书。 1、负责面向企业系统的Code Agent研发工作,深度参与到AI框架研究,工程研发和产品设计等重要环节,与产品、设计等团队合作推动AI产品落地; 2、负责优化模型成本、性能、全栈框架及生成效果,面向 原型生成、轻量系统生成、复杂业务系统等场景,打造业内领先的AI Coding产品; 3、调研和跟踪AI行业的前沿技术趋势,结合AI Coding方向,提供创新解决方案,推动技术在实际应用场景优化落地。 职位要求 1、2026届获得本科及以上学历; 2、具备AI应用项目的相关经验或算法背景,熟悉LLM应用架构, PE工程化和数据评测等,对于Agent,RAG,SFT、RL等有基本的认知和理解;具备前端/服务端/全栈开发经验,具备扎实的代码功底和系统设计能力,熟悉Nodejs/Golang/Python等编程语言,熟悉常用的框架和技术组件; 3、创新能力和创新意识比较强,对于不断探索新的AI技术和应用场景有强烈意愿和主观能动性,能紧跟AI领域的最新发展动态,不断提升自己的专业知识和技能; 4、具备AI IDE产品、Vibe Coding产品、AI研发工具/测试等AI Coding相关项目开发经验的优先。 岗位职责(具体工作内容) 岗位职责 1. 多模态数据抽取:直接参与文本、图像、视频等异构数据的清洗、高质量数据集构建及多模态特征对齐,确保数据服务于模型对金融语义的理解。 2. 大模型微调与优化:参与针对信贷垂直领域模型的SFT,提升模型在风险识别、逻辑推理和金融合规性方面的表现。 3. 强化学习与对齐:应用 PPO、DPO 或 GRPO 等强化学习算法,优化模型在复杂决策场景下的逻辑严密性,确保输出符合信贷风控的业务常识与法律合规。 4. 文档智能与多模态生成:优化文本、图像与视频的多模态理解模型,实现对信贷相关数据的自动解析与结构化提取。 5. 前沿技术探索:跟踪 LLM 领域的最新进展,如长文本处理、RAG 检索增强生成、Agent 智能体等,并尝试将其应用于信贷审批助手或风控策略生成。 任职资格(学历、目标院校、语言、技能、性格等要求) 岗位要求 1. 计算机、数学、统计学等相关专业在读硕博,具备扎实的机器学习与深度学习理论基础。 2. 具备优秀的编程能力,动手能力强,熟练掌握至少一种深度学习框架,能够独立完成Transformer相关模型的优化。 3. 具备优秀的论文阅读能力和逻辑思维,对金融信贷场景有好奇心,能够在快节奏的研发环境中快速迭代。 加分项 1. 在 ACL, EMNLP, CVPR, ICML, NeurIPS 等顶级学术会议发表过相关论文。 2. 在 Kaggle 或主流算法竞赛中取得过优异成绩。 3. 有处理金融、保险或信贷领域非结构化数据经验者。 注:若有其他疑问 可邮件咨询internrecruit@didiglobal.com 1、意图理解: 基于用户输入、历史上下文以及环境信息,理解用户真实意图、完成多轮改写query以及任务难度识别,提升识别&分流准确率。 2、Function-call:抽象并整合内外部服务能力为工具,训练大模型理解以及使用工具能力,解决用户需求,提升工具使用及参数提取准确率。 3、生成式推荐: 基于海量用户session行为,通过大模型挖掘用户长短期潜在意图以及需求,并预测用户后续行为,提升各场景引导入口CTR。 4、跟踪业界最新研究技术以及成果,并应用到实际产品中; 职位要求 1、计算机相关方向本科及以上学历。 2、良好的编程能力,熟悉主流深度学习工具PyTorch/TensorFlow等。 3、熟悉常见的机器学习和NLP算法,了解当前LLM热点和前沿技术,有过LLM相关的SFT/reward/RL训练经验。 4、有高水平会议或期刊论文者优先。 1、负责语言和视觉大模型在各类业务场景中的应用开发、集成与优化,推动大模型技术在实际产品中的落地和持续迭代; 2、参与大模型应用相关的需求分析、系统架构设计、模型微调与部署、RAG 、ControlNet、LoRA等,提升模型在各类场景下的应用效果; 3、跟进大模型领域前沿技术,参与公司AI平台能力建设,推动大模型相关工具链、数据处理流程和自动化运维体系的完善; 4、与产品、数据、业务等团队协作,建立大模型应用相关的数据分析、效果评估、问题定位与持续优化,提升用户体验和业务价值。 岗位要求 1、人工智能、计算机、软件工程、电子信息、自动化等相关专业; 2、熟悉主流大模型应用开发框架,掌握大模型原理(如Transformer架构、微调技术、向量数据库等),具备模型微调、推理优化、API集成等实际项目经验;或有大模型(如GPT、DeepSeek、SD系列等)应用开发经验,熟悉NLP/知识图谱/智能问答/对话系统/文生图/文生视频等领域; 3、具备扎实的编程能力,熟练掌握 Python、C++、Java 等至少一种编程语言。 1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。 任职要求 1、硕士及以上学历,计算机、电子、自动化等专业优先; 2、熟悉python/C++,熟悉linux使用,有扎实的算法与数据结构基础; 3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作; 4、了解AI infra 整体技术栈,有大模型相关训练或推理优化实战经验;有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之 1、设计严谨和科学的针对post train model的benchmark,准确评估基础模型能力,设计模型能力优化方向,提升基础模型的social intelligence 2、设计和训练奖励模型,深度参与基础模型的后训练优化,持续解决reward hacking问题和扩大强化学习训练规模 3、研究Reward System,涉及但不限于LLM-as-Judge, Generative Reward Model, Agentic Reward Model, Sandbox等技术 任职要求 1、硕士及以上学位在读,计算机、人工智能等相关专业优先 2、深入了解LLM后训练,具备LLM Benchmark设计/奖励信号设计/强化学习训练项目经验者优先 3、具备良好的中英文阅读和鉴赏能力,有良好的沟通合作能力 4、熟练使用python语言和pytorch框架