[Anthropic Claude] Anthropic 发布 Claude 2,性能更强、响应更长

Anthropic 发布 Claude 2,性能更强、响应更长

Anthropic 是一家由 OpenAI 前高管共同创立的人工智能公司,今天发布了最新的人工智能模型 Claude 2。Claude 2 是 Anthropic 的第二代大型语言模型,在性能上有所提升,响应更长。

Untitled

Claude 2 的最大特点是提高了单次可输入的长度——达 10 万 token,这几乎是目前商业可用模型中最大的。10 万 Token,意味着 Claude 2 可以一次性处理大约 75000 个单词,这相当于数百页的技术文档,甚至是书籍。

此外,Claude 2 的编程、数学、推理技能也得到了改善。在 Codex HumanEval(Python 编程测试)中,Claude 的得分从 1.3 的 56.0% 上升到了 2 的 71.2%。在小学数学问题(GSM8K)、多学科问答(MMLU)、科学问题(ARC-Challenge)等方面,Claude 2 较之前也均有所提升。

与 Claude 1.3 一样,Claude 2 可以实现文档搜索、总结,代码分析和编码等功能。

根据官网给出的示例,用户只需上传需要分析的文档,然后给出相应的指令,Claude 就会自动阅读文档,并作出回答。示例中的两个 pdf 大小总计近 300k,包含超过 83000 个 token,但 Claude 2 仍然成功地完成了任务。

另外,Anthropic 在其发布的论文中表示,Claude 2 具有支持 20 万 token 上下文的潜力,但目前暂未对外开放。

而在代码方面,官方展示了如何利用 Claude 2,在一幅静态地图上加入交互的动效。使用者只需将静态地图的 js 文件输入聊天框,就可以要求 Claude 2 分析代码的功能,而后输入想要实现的新功能,Claude 2 就会自动生成对应的代码。

此次更新还使用了最新的数据集,包括网站、第三方授权数据集和 2023 年初用户自愿提供的数据。相较之下,OpenAI 的 ChatGPT 未联网时,数据集还停留在 2021 年底。

不过,Anthropic 上市负责人 Sandy Banerjee 在接受 TechCrunch 时表示,Claude 2 与 1.3 在模型上并没有什么不同,只是 " 不断迭代的模型开发方法的产物 "。

截至目前,Anthropic 声称已有 " 数千客户 " 以及一批合作伙伴。公司的投资者之一谷歌,已承诺投资 3 亿美元,以换取该公司 10% 的股权。

Anthropic 还表示,要继续研发大模型,未来两年内公司还需要约 50 亿美元,其中大部分资金将用于计算。

Claude 2 的发布是人工智能领域的一大进步,它将使人工智能技术更加强大和实用。随着 Claude 2 的不断发展,我们可以期待人工智能技术在未来为我们的生活带来更多改变。

参考链接

[1] Claude - https://claude.ai/login

[2] Anthropic \ Claude 2 - https://www.anthropic.com/index/claude-2