近期消息显示,华为公司即将发布一款名为”盘古Chat”的多模态千亿级大模型产品,该产品的竞争对手是ChatGPT。预计华为盘古Chat将在今年7月7日的华为云开发者大会(HDC.Cloud2023)上正式发布,并进行内测。据悉,该产品主要面向ToB/G政企端客户。
盘古Chat基于华为盘古大模型研发,该大模型项目于2020年11月在华为云内部立项成功。华为为训练盘古大模型调用了超过2000块昇腾910芯片,并进行了超过2个月的数据训练。据华为内部透露,每年大模型训练时调用的GPU/TPU卡超过4000片,三年的大模型算力成本高达9.6亿元人民币。
根据华为公布的论文数据显示,华为盘古PanGu-Σ大模型的参数数量最多可达到1.085万亿,并采用华为自研的MindSpore框架进行开发。总体而言,PanGu-Σ大模型在对话方面的表现可能接近于GPT-3.5的水平。
华为云官网介绍显示,盘古大模型包含了NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个模型。通过模型泛化,解决了传统AI开发模式下无法解决的规模化和产业化难题,并且可以支持多种自然语言处理任务,例如文本生成、文本分类、问答系统等。
具体来说,盘古NLP大模型首次采用了Encoder-Decoder架构,兼顾了NLP大模型的理解能力和生成能力,保证了模型在不同系统中的灵活嵌入性。在下游应用中,只需少量样本和可学习参数即可快速微调和适配千亿规模的大模型。该模型在智能舆论和智能营销方面表现出色。
盘古CV大模型是业界最大的CV大模型之一,首次实现了模型按需抽取的功能,并兼顾了判别和生成能力。根据模型大小和运行速度的需求,它可以自适应地抽取不同规模的模型,使得AI应用开发能够快速实现落地。通过层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,显著提升了小样本学习的能力,在智能巡检和智慧物流等领域展现出良好的表现。
东吴证券在其华为盘古大模型产业链研报中指出,华为盘古大模型具备人才储备和算力自主可控的优势,有望成为国内领先的大模型。预计其生态产业链将迎来加速发展,其中包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。
以上是关于华为盘古Chat的相关介绍,该多模态千亿级大模型产品的发布将为人工智能领域带来突破性进展,为各个应用领域提供更高效、智能化的解决方案。