软餐获悉,Anthropic 宣布推出新版大语言模型 Claude Instant 1.2 。和其前代 Claude Instant 1.1 相比,新版本在推理和代码任务上有了 “实质性的改进” 。在 Codex P@1 Python 编程基准测试中,它的得分为 58.7%,而旧版本的得分为 52.8% 。在 GSM8k 小学数学问题基准测试中,其得分为 86.7%,旧版本的得分为 80.9% 。
Claude Instant 1.2 只能通过 API 供企业使用,但用户可通过访问 AI 聚合平台 Poe 来访问它。