阿里达摩院开源大模型Video-LLaMA:拓展音视频理解领域

阿里达摩院开源大模型Video-LLaMA:拓展音视频理解领域

最近,阿里达摩院正式向公众开放了一款名为Video-LLaMA的大型模型。该模型具备感知和理解音视频信号的能力,并能根据用户的指令完成一系列复杂的音视频任务,例如音视频描述、写作和问答等。

联系我们

联系我们

邮箱: contact@webhostingtalk.cn

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部