科大讯飞星火X1升级，数学能力比肩DeepSeek R1和OpenAI O1

科大讯飞星火X1升级，数学能力对标DeepSeek R1和OpenAI o1

科大讯飞星火 X1 升级：数学能力全面对标国际领先水平

近日，科大讯飞宣布其深度推理大模型星火 X1 进行了重大升级，并推出了一系列新产品。此次升级使星火 X1 在数学能力上达到了与 DeepSeek R1 和 OpenAI o1 相当的水平。特别是在处理竞赛级别的数学难题时，表现尤为突出。此外，星火 X1 在中小学数学作业的批改、辅导及题目推荐等方面也展现出显著优势。

测试集涵盖了2023/2024年度各学段考试真题、模拟题以及竞赛题，英文测试集则来自 AIME 2024/2025 和 MATH 500 竞赛集。

讯飞晓医首发星火医疗大模型 X1：大幅降低医疗幻觉问题

此次升级中，讯飞医疗首次推出了星火医疗大模型 X1，旨在解决医疗咨询中的“建议宽泛不实用”问题。新模型大幅降低了医疗幻觉现象，在复杂问题的回答上能够逐步解释循证过程，提高了逻辑正确性、专业性和可解释性。在诊断推荐、健康咨询和检查检验报告解读等任务上，星火医疗大模型 X1 的效果已超越 GPT-4 和 DeepSeek R1。

该模型已正式应用于 AI 健康助手“讯飞晓医”，并与个人健康档案深度融合。用户在咨询疾病用药时，晓医不仅能够指出正确的用药原则，还能结合用户的既往健康状况，提供更为个性化和详实的处理意见和注意事项。

星火教师助手：实现教学思维可视化

基于星火 X1 的升级，面向备授课的星火教师助手也进行了优化，提供了更清晰、更详实的 AI 教学思路。具体改进包括：

- 备课时：相比之前的线性流程生成教学设计，现在星火教师助手能更好地理解教师意图，明确教学重难点和目标，并在生成过程中详细说明每一步的逻辑，帮助教师理解和创新。

- 授课过程中：通过显性化呈现思维链，师生可以实时观测认知思维的构建过程，使课堂互动更加直观，有助于探究式课堂的开展。

这些功能已在数学、语文、历史等多个学科中应用，实现了教育教学中 AI 工具的“思维可视化”，从基础问题到复杂问题的解答都有迹可循，进一步促进了教学创新和学生高阶思维能力的培养。

AI 法官助理：提升法律推理能力

科大讯飞将星火长思维链深度推理技术与法律法规、司法解释及法律专家思维链深度融合，解决了传统大模型存在的知识幻觉问题，提升了证据审查、量刑辅助、裁判观点小编建议等复杂场景所需的法律推理能力。

例如，在裁判观点小编建议场景中，AI 法官助理可以根据卷宗材料小编建议案件事实，逐条分析对比相关法律法规和案例，并输出附有法理依据的裁判观点，为办案提供决策依据。目前，星火大模型的能力已贯穿案情分析、证据审查、庭审提纲辅助生成、裁判辅助等多个环节，助力司法工作的智能化发展。