具有更强的代码能力!更长的上下文!免费!
近日,Anthropic公司发布了他们最新的模型Claude 2,支持200,000 token,可免费使用。
Anthropic公司是由OpenAI前研究副总裁Dario Amodei等人在2021年创建,该公司还得到了谷歌、Salesforce和Zoom等公司的投资,目前估值为 41 亿美元。今年5月,Anthropic便是受邀参加白宫会议的四家人工智能公司之一,其他三家分别为谷歌、微软和OpenAI。
Claude 2 相对于ChatGPT的优势——
1、Claude 2 比 GPT-4 便宜5倍。
2、Claude 2 有更新的数据。这些数据是网站、第三方授权的数据集以及2023年初用户自愿提供的数据的混合。
3、Claude 2 在 GRE 写作和 HumanEval 编程基准测试上表现优于 GPT-4。
4、Claude 2 上下文窗口有100,000个token,是所有商业模型中最大的。
5、Claude 2 可以分析大约75,000个单词,大约是一本书的长度;相比之下,ChatGPT 可一次性处理 3,000 个单词的文本,而 GPT 4 则可以处理 25,000 个单词的文本。
6、Claude 2 可以轻松处理任何与代码相关的任务。
网友实测Claude 2 的代码功能:
网友实测Claude 2 的文档总结功能:
Claude 2技术论文:https://arxiv.org/abs/2212.08073
一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。7月19日,Meta 终于发布了免费可商用版本 Llama 2。
此次 Meta 发布的 Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体。相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的tokens 上训练的,精调 Chat 模型是在 100 万人类标记数据上训练的。
在几乎所有基准上,Llama 2 70B 的结果均与谷歌 PaLM (540B) 持平或表现更好,不过与 GPT-4 和 PaLM-2-L 的性能仍存在较大差距。
Llama 2技术论文:
https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
7 月 7 日,在开发者大会 2023(Cloud)上,华为重磅发布盘古大模型 3.0,将围绕行业重塑、技术扎根、开放同飞三大创新方向,为行业客户、伙伴及开发者提供更好的服务。
模型聚焦三层架构,赋能千行百业——
L0 层包括NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的多种技能需求。盘古3.0 提供了100 亿、380 亿、710 亿和1000 亿参数等基础大模型,以匹配不同场景、时延、响应速度的行业多样化需求。
L1 层是多个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0 和L1 层上,为客户训练自有的专用大模型。
L2 层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
7月19日,IDC发布《AI大模型技术能力评估报告,2023》,IDC对其中9家技术服务提供商进行了技术评估,分别为阿里巴巴、百度、第四范式、科大讯飞、澜舟科技、云从科技、智谱AI、中国电信智科以及中科闻歌。
9家大模型技术能力综合评分:
另外,百度文心大模型、阿里巴巴通义大模型、科大讯飞星火大模型、智谱AI大模型在通用能力上表现满分。“通用能力”指标反映的是大模型的整体技能,包括语音识别、语音合成等自然语言处理;图片生成、图片搜索等计算机视觉;机器学习/深度神经网络等底层技术能力的差异化优势;意图识别、泛化能力、知识库构建能力等。
主流大模型各项指标评分:
早前,沙利文根据AI大模型在产品技术能力、战略愿景能力、生态开放能力三个维度的综合表现对比相关厂商的综合竞争力,评分靠前的依次为商汤(SenseCore 商汤 AI 大装置 + 商汤日日新 SenseNova大模型体系)、百度(AI 大底座+文心大模型)、阿里(M6-OFA +“通义”大模型)、华为(ModelArts + 盘古大模型)、腾讯(HCC 高性能计算集群+混元大模型):