大模型动态简报
发布时间:2023-07-21

一、GPT-4最强竞品Claude 2发布

具有更强的代码能力!更长的上下文!免费!

近日,Anthropic公司发布了他们最新的模型Claude 2,支持200,000 token,可免费使用。

Anthropic公司是由OpenAI前研究副总裁Dario Amodei等人在2021年创建,该公司还得到了谷歌、Salesforce和Zoom等公司的投资,目前估值为 41 亿美元。今年5月,Anthropic便是受邀参加白宫会议的四家人工智能公司之一,其他三家分别为谷歌、微软和OpenAI。

Claude 2 相对于ChatGPT的优势——

1、Claude 2 比 GPT-4 便宜5倍。

2、Claude 2 有更新的数据。这些数据是网站、第三方授权的数据集以及2023年初用户自愿提供的数据的混合。

3、Claude 2 在 GRE 写作和 HumanEval 编程基准测试上表现优于 GPT-4。

4、Claude 2 上下文窗口有100,000个token,是所有商业模型中最大的。

5、Claude 2 可以分析大约75,000个单词,大约是一本书的长度;相比之下,ChatGPT 可一次性处理 3,000 个单词的文本,而 GPT 4 则可以处理 25,000 个单词的文本。

6、Claude 2 可以轻松处理任何与代码相关的任务。

网友实测Claude 2 的代码功能:

网友实测Claude 2 的文档总结功能:

Claude 2技术论文:https://arxiv.org/abs/2212.08073

二、开源大模型Llama 2可直接商用

一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。7月19日,Meta 终于发布了免费可商用版本 Llama 2。

此次 Meta 发布的 Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体。相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的tokens 上训练的,精调 Chat 模型是在 100 万人类标记数据上训练的。

在几乎所有基准上,Llama 2 70B 的结果均与谷歌 PaLM (540B) 持平或表现更好,不过与 GPT-4 和 PaLM-2-L 的性能仍存在较大差距。

Llama 2技术论文:

https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

三、华为盘古大模型3.0发布

7 月 7 日,在开发者大会 2023(Cloud)上,华为重磅发布盘古大模型 3.0,将围绕行业重塑、技术扎根、开放同飞三大创新方向,为行业客户、伙伴及开发者提供更好的服务。

模型聚焦三层架构,赋能千行百业——

L0 层包括NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的多种技能需求。盘古3.0 提供了100 亿、380 亿、710 亿和1000 亿参数等基础大模型,以匹配不同场景、时延、响应速度的行业多样化需求。

L1 层是多个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0 和L1 层上,为客户训练自有的专用大模型。

L2 层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。

四、国内大模型能力对比

7月19日,IDC发布《AI大模型技术能力评估报告,2023》,IDC对其中9家技术服务提供商进行了技术评估,分别为阿里巴巴、百度、第四范式、科大讯飞、澜舟科技、云从科技、智谱AI、中国电信智科以及中科闻歌。

9家大模型技术能力综合评分:

另外,百度文心大模型、阿里巴巴通义大模型、科大讯飞星火大模型、智谱AI大模型通用能力上表现满分。“通用能力”指标反映的是大模型的整体技能,包括语音识别、语音合成等自然语言处理;图片生成、图片搜索等计算机视觉;机器学习/深度神经网络等底层技术能力的差异化优势;意图识别、泛化能力、知识库构建能力等。

主流大模型各项指标评分:

早前,沙利文根据AI大模型在产品技术能力、战略愿景能力、生态开放能力三个维度的综合表现对比相关厂商的综合竞争力,评分靠前的依次为商汤(SenseCore 商汤 AI 大装置 + 商汤日日新 SenseNova大模型体系)、百度(AI 大底座+文心大模型)、阿里(M6-OFA +“通义”大模型)、华为(ModelArts + 盘古大模型)、腾讯(HCC 高性能计算集群+混元大模型):

分类: 政企热点 标签: ,