LLM/VLM
views
| comments
范围说明
LLM/VLM 领域记录语言模型与视觉语言模型的能力边界、后训练方法、多模态推理、评测框架以及它们与 agent、具身系统的接口关系。
关键问题
- 后训练、合成数据与 test-time scaling 分别解决什么问题?
- 多模态模型的 grounding 与 reasoning 应该如何统一理解?
- 基础模型能力如何服务后续 agent 与具身系统?
LLM/VLM 领域记录语言模型与视觉语言模型的能力边界、后训练方法、多模态推理、评测框架以及它们与 agent、具身系统的接口关系。