5月27日,面壁智能联合知乎在2023中国国际大数据产业博览会上发布了最新的大语言模型成果。这次发布会上,面壁智能自研模型CPM-Bee 10B全面开源,并且推出了对话类模型产品“露卡”(Luca)。此次发布会是面壁智能和知乎双方继“知海图AI”大模型之后的第二次联合公开发布。
面壁智能将自研的CPM-Bee 10B模型开源在OpenBMB开源社区。CPM系列大模型是面壁智能团队自主研发的模型,享誉已久。其中包括国内首个中文大模型CPM-1。最新项目是百亿大模型训练直播项目CPM-Live,而CPM-Bee则是第二期训练成果。
CPM-Bee模型是从零开始自主训练的,基于Transformer架构,对中英文双语表现优秀。该模型拥有百亿量级的参数和万亿级的高质量语料,同时还配套OpenBMB大模型系统生态支持。
在中文的ZeroCLUE评测基准上,CPM-Bee模型能够明显超越其他模型,稳居中文大模型第一的位置。而在英文评测基准上,CPM-Bee也展现出了与开源模型LLaMA相当的效果。
CPM-Bee 10B模型将全面开源,并且可以用于商业目的。如果企业需要将该模型用于商业用途,只需通过企业实名邮件申请并获得官方授权证书即可进行商业使用。面壁智能表示一直坚持开源路线,并将持续拥抱开源,促进大模型领域技术和生态的繁荣。
基于CPM-Bee作为基座模型,面壁智能公司还发布了智能大语言模型产品“露卡”(Luca)。经过微调后,基座模型可以进一步完成进阶任务,成为专家级的AI助手。该产品在开源基础模型上进行了进一步的性能提升,能够进行智能交互并支持多轮对话。
在发布会现场的演示中,“露卡”(Luca)展示了多项能力。它不仅可以帮助人们了解世界知识、处理数理逻辑、编写程序代码和激发创作灵感,还能够利用海量知识数据,帮助人们更好地获取信息、做出规划和解决问题。此外,“露卡”(Luca)还具备优秀的多模态理解能力,甚至可以查找论文并生成摘要。
目前,“露卡”(Luca)将首先向部分用户发出邀请,进行先行试用并提供反馈。面壁智能将根据反馈持续迭代和改进产品,推动模型能力不断升级。待产品进一步成熟后,将向公众开放测试。