【TechWeb】5月23日消息,Anthropic正式对外发布了新一代Claude模型:Claude Opus 4和Claude Sonnet 4。凭借“世界上最好的编码模型”的表现,在全球掀起新一波大模型关注热潮。
根据亚马逊云科技透露的数据,Claude系列模型广受客户欢迎,以Anthropic的上一款模型Claude Sonnet 3.7为例,该模型在发布后的五周内,Amazon Bedrock客户使用率比同期的上一代Claude模型高出300%。
Anthropic强调,Claude Opus 4和Sonnet 4的推出更是将让AI系统成为能力一直增长的合作伙伴,包括创意与知识工作。
Claude Opus 4和Claude Sonnet 4这两款全新混合推理模型可以依据需求在快速响应和深度思考模式间灵活切换,为编码、高级推理和多步骤工作流领域带来全新标准。它们不仅能在复杂的长时间推理任务中保持稳定的性能,更能驱动AI agents将耗时数小时的任务浓缩至数分钟内完成。
Anthropic将Claude Opus 4称之为“世界上最好的编程模型”,能在复杂、长时间运行的任务和智能体工作流中表现出稳定的性能。可独立完成从规划到执行的复杂编码项目和agent工作流。该模型还能以自然语言生成长篇创意内容。金融行业客户可利用Claude Opus 4进行agent搜索与研究,例如连接海量市场报告以获取行业洞察;营销类客户则可利用该模型自主管理多渠道的营销活动。
Claude Sonnet 4是Claude Sonnet 3.7的重大升级,以编程和推理能力为核心,同时能更精确地响应用户提示词。Claude Sonnet 4平衡性能与成本,很适合高吞吐量的业务场景,是大多数生产级应用的理想之选。Claude Sonnet 4可为各类业务赋能,从实时客服agents到日常开发工作(如代码审查与漏洞修复),并作为任务专用的子agents同时处理搜索、数据分析或内容合成等多类任务。旅游与酒店行业客户可使用Claude Sonnet 4近乎实时处理客户请求并提供个性化响应。
在编程、工具使用、视觉推理、数学等领域的基准测试中,这两款模型超越了OpenAI o3,而在多语言问答、研究生级别推理任务上,Claude Opus 4与OpenAI o3得分持平。
同时,Claude 4系列模型的自主性逐步提升,Claude 3.7最多可自主运行45分钟,而Claude 4可以独立运行数小时,最高达到7小时。连续7小时自助编程不是梦了。
Claude Opus 4和Sonnet 4不再仅仅生成内容,而是更像专业的虚拟合作伙伴——专注复杂任务、保留上下文,并在无需持续指导下提供完整的解决方案。这一能力改变了企业应对各种挑战的方式,从开发软件系统到制定全面的经营销售的策略。对于普通用户而言,它意味着与更理解需求的AI协作,且AI能独立承担更大比例的项目工作。
亚马逊云科技也建议使用Converse API,因为它提供了一致的 API,可与所有支持消息的 Amazon Bedrock 模型兼容。这在某种程度上预示着用户只需编写一次代码,即可将其用于不同的模型。
例如,假设用户编写了一个agent,用于在代码库合并变更前审查代码。用户写了如下代码,利用 Bedrock Converse API 发送系统和用户提示。然后,该agent会使用流式传输的结果。
Claude Opus 4 现已在北美以下 AWS 区域上线:美国东部(俄亥俄州、弗吉尼亚州北部)和美国西部(俄勒冈州)。Claude Sonnet 4 不仅在北美 AWS 区域上线,还在亚太地区和欧洲地区上线:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(海得拉巴、孟买、大阪、首尔、新加坡、悉尼、东京)和欧洲(西班牙)。
亚马逊云科技表示,Claude Opus 4和Claude Sonnet 4在Amazon Bedrock的推出,进一步丰富了客户使用Anthropic最先进的模型进行AI创新的选择,帮助客户打造更出色、更具变革性的应用,同时具备企业级安全防护和负责任的AI管控体系。