日前,Anthropic方面发布新一代中端主力模型Claude Sonnet 5,以及面向科研人员的AI工作台Claude Science。
据了解,相比上一代Sonnet 4.6,Sonnet 5在推理、工具调用、编程和知识工作等关键能力上都有实质提升,整体表现已接近Opus 4.8。以Agent编程能力为例,Sonnet 5在SWE-bench Pro中录得63.2%的得分,较Sonnet 4.6的58.1%提升5.1个百分点,距离Opus 4.8的69.2%的差距进一步收窄。
值得一提的是,Sonnet 5具备自主制定长期规划、跨工具协同调用的能力,可在无人工干预下长时间独立运行,贴合目前开发者群体执行长程任务等需求。对此Anthropic方面强调,Claude Sonnet 5的设计目标是成为迄今为止最具自主性的Sonnet模型。

目前Sonnet 5已面向所有用户开放,并已成为Claude免费版和Pro版用户的默认模型。需要注意的是,由于Sonnet 5采用了全新的分词器(Tokenizer),在提升底层精度的同时将导致同样的文本输入会被切分成更多Token,大致是原来的1到1.35倍。为应对这一变化对于用户成本的影响,Anthropic为Sonnet 5启动了阶段性价格促销。
据了解,在截至今年8月31日的推广期内,Sonnet 5 API价格将降至每百万Token输入2美元、输出10美元。此后,Sonnet 5 API价格将恢复为标准计费,即每百万Token输入3美元、输出15美元。
而Claude Science则是基于Claude Opus 4.8等模型运行,集成了研究人员最常用的工具和软件包,可以一站式完成覆盖科研工作的各个阶段的工作,其中包括分析文献、执行多步骤研究、生成详细的产出物等。而且Claude Science每一项产出都带有完整的制作过程记录,方便研究者验证和复现。
Anthropic方面强调,与Jupyter Notebook类似,用户无论身在何处都可以访问Claude Science,包括通过本地macOS或Linux系统,以及通过SSH远程连接,或是直接登录HPC集群节点使用。
据了解,在过去的几个月里,已有研究人员借助Claude Science完成单细胞RNA测序分析、CRISPR筛选设计、蛋白质结构预测、化学信息学等任务。例如设计组织靶向药物的公司Manifold Bio,就使用Claude Science为最新一批实验筛选靶点。
目前,Claude Science的测试版已登录macOS和Linux平台,并率先面向Claude Pro、Max、Team和Enterprise用户开放。此外,Anthropic方面还宣布将为至多50个科学项目提供资助。
值得一提的是,继6月上旬Anthropic发布Claude Fable 5和Claude Mythos 5这两款全新Mythos模型,但美国政府以担忧AI安全护栏存在漏洞为由对这2款模型实施出口管制,因此宣布对全部用户暂停这2款模型的访问后。近日Anthropic方面宣布,已正式解除对Claude Fable 5和Claude Mythos 5的出口限制,即将全面恢复这两款模型的访问权限。
【本文图片来自网络】
