研究历程
多模态模型
多模态大模型最全综述
【
Multimodal Foundation Models: From Specialists to General-Purpose Assistants
】【2023】【微软】:只要你想学习多模态基础模型的基础知识和最新进展,不管你是专业研究员,还是在校学生,它都是你的“菜”。从五个具体研究主题介绍了:1)视觉理解、2)视觉生成、3)统一视觉模型、4)LLM加持的多模态大模型、5)多模态Agent。