TenStep

LLM/VLM

研究范围

基础模型与多模态模型总入口,聚焦训练方式、推理能力、数据路线与评测。

关注点

post-trainingreasoningmultimodal groundingevaluation

范围说明

LLM/VLM 领域记录语言模型与视觉语言模型的能力边界、后训练方法、多模态推理、评测框架以及它们与 agent、具身系统的接口关系。

关键问题

  • 后训练、合成数据与 test-time scaling 分别解决什么问题?
  • 多模态模型的 grounding 与 reasoning 应该如何统一理解?
  • 基础模型能力如何服务后续 agent 与具身系统?

主题路线

最近材料