Blog Works Follow Wiki Tutorials Annual Resume 🚇

LLM/VLM

views | comments

研究范围

基础模型与多模态模型总入口，聚焦训练方式、推理能力、数据路线与评测。

返回知识库

浏览材料

综述 0 主题 0 材料 0

关注点

post-trainingreasoningmultimodal groundingevaluation

范围说明

LLM/VLM 领域记录语言模型与视觉语言模型的能力边界、后训练方法、多模态推理、评测框架以及它们与 agent、具身系统的接口关系。

关键问题

后训练、合成数据与 test-time scaling 分别解决什么问题？
多模态模型的 grounding 与 reasoning 应该如何统一理解？
基础模型能力如何服务后续 agent 与具身系统？

主题路线

最近材料