主要更新
更新GPT-5.5、GPT-5.4 Mini、DeepSeek V4和xAI Grok 4.3等大模型。
OpenAI GPT-5.5
GPT-5.5 是 OpenAI 专为复杂专业工作负载设计的尖端模型,它在 GPT-5.4 的基础上进一步增强了推理能力,提高了可靠性,并在处理高难度任务时提升了令牌效率。该模型具备超过 100 万令牌的上下文窗口(92.2 万输入令牌,12.8 万输出令牌),支持文本和图像输入,可在单一系统内实现大规模推理、编程及多模态工作流。
OpenAI GPT-5.4 Mini
GPT-5.4 mini 将 GPT-5.4 的核心能力融入了一个更快、更高效的模型中,该模型专为高吞吐量工作负载进行了优化。它支持文本和图像输入,在推理、编码和工具使用方面表现出色,同时降低了大规模部署的延迟和成本。 该模型专为需要兼顾能力与效率的生产环境而设计,非常适合大规模运行的聊天应用、编程助手和代理工作流。GPT-5.4 mini 能够可靠地执行指令,具备扎实的多步骤推理能力,并在各种任务中保持稳定的性能,同时提高了成本效益。
DeepSeek V4 Flash
DeepSeek V4 Flash 是 DeepSeek 推出的一款针对效率进行优化的专家混合模型,总参数数为 2840 亿,有效参数数为 130 亿,支持 100 万令牌的上下文窗口。该模型专为快速推理和高吞吐量工作负载而设计,同时保持了强大的推理和编码性能。 该模型集成了混合注意力机制,可高效处理长上下文。支持高(high)和超高(xhigh)推理强度;其中 xhigh 对应最大推理强度。该模型非常适合编程助手、聊天系统和智能代理工作流等应用场景,这些场景中响应速度和成本效益至关重要。
DeepSeek V4 Pro
DeepSeek V4 Pro 是 DeepSeek 推出的一款大规模专家混合模型,总参数数达 1.6 万亿,有效参数数达 490 亿,支持 100 万令牌的上下文窗口。该模型专为高级推理、编程及长时效代理工作流设计,在知识、数学和软件工程基准测试中均表现优异。 该模型基于与 DeepSeek V4 Flash 相同的架构构建,引入了混合注意力系统以实现高效的长上下文处理。支持高(high)和 xhigh 两种推理强度,其中 xhigh 对应最大推理强度。该模型非常适合全代码库分析、多步骤自动化和大规模信息合成等复杂工作负载,在这些场景中,能力与效率均至关重要。
xAI Grok 4.3
Grok 4.3 是 xAI 推出的一款推理模型。它支持文本和图像输入,并生成文本输出,适用于代理工作流、遵循指令的任务以及需要高事实准确度的应用场景。推理的努力程度可在无/低/中/高(默认低)之间进行配置。 该模型支持 100 万令牌的上下文窗口,且无输出令牌限制,因此非常适合长文档分析、深度研究以及多步骤代理任务。定价采用分级制:总令牌数超过 20 万的请求将按更高费率计费。
联系
官网: https://ilark.io
文档: https://doc.ilark.io
Github: https://github.com/ilarkdao
Discord: https://discord.gg/p9KTdmVrfb
Medium: https://medium.com/@ilark_dao
twitter: _dao
Gmail: larkio2021@gmail.com