文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3！即将上线千帆大模型平台

来源：紫牛新闻

2025-03-26 22:58:17

今日，据媒体报道，在多个公开数据集测评中，百度最新发布的文心大模型X1，在数学、代码、推理等能力上表现优异，超越升级后的DeepSeek-V3-0324。

在数学场景中，GSM8K数据集测试后结果显示，文心X1得分95.6，DeepSeek-V3-0324得分93.6；代码生成层面，HumanEval数据集测试后结果显示，文心X1得分90.9，DeepSeek-V3-0324得分86.6；在知识推理层面，C-Eval数据集测试后结果显示，文心大模型X1得分88.6，DeepSeek-V3-0324得分85.1。

近日，DeepSeek官方宣布V3模型完成小版本升级的消息，包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前，百度正式发布文心大模型X1，具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型，兼备准确、创意和文采，在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉，文心大模型X1即将上线千帆大模型平台，API调用价格为DeepSeek-R1调用价格的50%。

校对潘政

| 最新

人民日报任仲平文章：为什么中国意味着确定性、未来性、机遇性

| 美图

【紫牛头条】帕劳9名中国潜水者失联27小时讲述获救过程：鲨鱼绕着我们转，感谢当地华人倾力搜救

【读苏声】一票解锁“包邮区”，带来新活力

【时习之·一席话】扩大内需，不断释放经济活力潜力

2024年中央八项规定精神贯彻执行情况调查网络调查问卷

强强联合！比亚迪方程豹与华为乾崑智驾合作

| 微矩阵