近年来,大模型 (Large Models, LMs) 通过在海量跨领域数据上进行大规模预训练,逐步演化出一个可迁移的通用知识库,并展现出强大的语义理解、上下文推理、任务分解与多步规划能力。这些能力使其在处理开放世界问题时表现出显著的潜力,尤其适用于需要灵活应变、动态调整的场景。
为充分发挥大模型在真实开放环境中的决策潜力,我们聚焦于以下研究方向:
1. 大模型智能体 (AI Agent): 以大模型为"大脑",赋予其目标理解、任务分解、工具调用与经验记忆的能力,使其能在复杂任务中主动决策与动态调整。
2. 具身大模型 (Embodied VLA): 将大模型嵌入物理环境中,通过融合视觉-语言-动作(VLA)模型与机器人控制系统,使其具备环境感知与物理交互能力。大模型不仅"知道该做什么",更能"看见环境变化"、"走到指定位置"、"抓取目标物体",并通过与环境的实时交互不断优化行为策略。
3. 大模型分布式训练 (Distributed LM Training): 为支撑大模型的高效训练,研究面向大模型的分布式训练系统。通过协同优化数据并行、张量并行与流水线并行策略,设计低通信开销、高可扩展性的训练框架,以实现大模型在异构集群上的稳定、高效训练。
如果您对我们小组的研究方向感兴趣,并有意向申请我们小组的日常实习、考研、保研或博士,请访问我们的实验室招生主页,填写申请表,并在申请表中将我们小组的意向列为第一。
如果您对招生、科研方向方面有疑问,或想咨询更多关于我们小组的信息,欢迎邮件联系吴铎 wu-d24@mails.tsinghua.edu.cn (智能体与具身大模型方向),或路荣伟 lurw24@mails.tsinghua.edu.cn (大模型分布式训练方向)。