乐思网络舆情监测，始于2003 » 大模型动态简报

大模型动态简报

发布时间：2023-07-21 FZ

一、GPT-4最强竞品Claude 2发布

具有更强的代码能力！更长的上下文！免费！

近日，Anthropic公司发布了他们最新的模型Claude 2，支持200,000 token，可免费使用。

Anthropic公司是由OpenAI前研究副总裁Dario Amodei等人在2021年创建，该公司还得到了谷歌、Salesforce和Zoom等公司的投资，目前估值为 41 亿美元。今年5月，Anthropic便是受邀参加白宫会议的四家人工智能公司之一，其他三家分别为谷歌、微软和OpenAI。

Claude 2 相对于ChatGPT的优势——

1、Claude 2 比 GPT-4 便宜5倍。

2、Claude 2 有更新的数据。这些数据是网站、第三方授权的数据集以及2023年初用户自愿提供的数据的混合。

3、Claude 2 在 GRE 写作和 HumanEval 编程基准测试上表现优于 GPT-4。

4、Claude 2 上下文窗口有100,000个token，是所有商业模型中最大的。

5、Claude 2 可以分析大约75,000个单词，大约是一本书的长度；相比之下，ChatGPT 可一次性处理 3,000 个单词的文本，而 GPT 4 则可以处理 25,000 个单词的文本。

6、Claude 2 可以轻松处理任何与代码相关的任务。

网友实测Claude 2 的代码功能：

网友实测Claude 2 的文档总结功能：

Claude 2技术论文：https://arxiv.org/abs/2212.08073

二、开源大模型Llama 2可直接商用

一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。7月19日，Meta 终于发布了免费可商用版本 Llama 2。

此次 Meta 发布的 Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体。相比于 Llama 1，Llama 2 的训练数据多了 40%，上下文长度也翻倍，并采用了分组查询注意力机制。具体来说，Llama 2 预训练模型是在 2 万亿的tokens 上训练的，精调 Chat 模型是在 100 万人类标记数据上训练的。

在几乎所有基准上，Llama 2 70B 的结果均与谷歌 PaLM (540B) 持平或表现更好，不过与 GPT-4 和 PaLM-2-L 的性能仍存在较大差距。

Llama 2技术论文：

https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

三、华为盘古大模型3.0发布

7 月 7 日，在开发者大会 2023（Cloud）上，华为重磅发布盘古大模型 3.0，将围绕行业重塑、技术扎根、开放同飞三大创新方向，为行业客户、伙伴及开发者提供更好的服务。

模型聚焦三层架构，赋能千行百业——

L0 层包括NLP、视觉、多模态、预测、科学计算五个基础模型，提供满足行业场景中的多种技能需求。盘古3.0 提供了100 亿、380 亿、710 亿和1000 亿参数等基础大模型，以匹配不同场景、时延、响应速度的行业多样化需求。

L1 层是多个行业大模型，华为云既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等大模型；也可以基于行业客户的自有数据，在盘古大模型的L0 和L1 层上，为客户训练自有的专用大模型。

L2 层提供了更多细化场景的模型，更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景，为客户提供“开箱即用”的模型服务。

四、国内大模型能力对比

7月19日，IDC发布《AI大模型技术能力评估报告，2023》，IDC对其中9家技术服务提供商进行了技术评估，分别为阿里巴巴、百度、第四范式、科大讯飞、澜舟科技、云从科技、智谱AI、中国电信智科以及中科闻歌。

9家大模型技术能力综合评分：

另外，百度文心大模型、阿里巴巴通义大模型、科大讯飞星火大模型、智谱AI大模型在通用能力上表现满分。“通用能力”指标反映的是大模型的整体技能，包括语音识别、语音合成等自然语言处理；图片生成、图片搜索等计算机视觉；机器学习/深度神经网络等底层技术能力的差异化优势；意图识别、泛化能力、知识库构建能力等。

主流大模型各项指标评分：

早前，沙利文根据AI大模型在产品技术能力、战略愿景能力、生态开放能力三个维度的综合表现对比相关厂商的综合竞争力，评分靠前的依次为商汤（SenseCore 商汤 AI 大装置 + 商汤日日新 SenseNova大模型体系）、百度（AI 大底座+文心大模型）、阿里（M6-OFA +“通义”大模型）、华为（ModelArts + 盘古大模型）、腾讯（HCC 高性能计算集群+混元大模型）：

分类: 政企热点标签: AI, 大模型

上一篇 : 乐思舆情监测：高校如何做好舆情管理？

下一篇 : 恒大之大