标签： Video-LLaMA

阿里达摩院开源大模型Video-LLaMA：拓展音视频理解领域

2023年6月14日 46赞

最近，阿里达摩院正式向公众开放了一款名为Video-LLaMA的大型模型。该模型具备感知和理解音视频信号的能力，并能根据用户的指令完成一系列复杂的音视频任务，例如音视频描述、写作和问答等。