近日,科大讯飞宣布其深度推理大模型星火 X1 进行了重大升级,并推出了一系列新产品。此次升级使星火 X1 在数学能力上达到了与 DeepSeek R1 和 OpenAI o1 相当的水平。特别是在处理竞赛级别的数学难题时,表现尤为突出。此外,星火 X1 在中小学数学作业的批改、辅导及题目推荐等方面也展现出显著优势。
测试集涵盖了2023/2024年度各学段考试真题、模拟题以及竞赛题,英文测试集则来自 AIME 2024/2025 和 MATH 500 竞赛集。
此次升级中,讯飞医疗首次推出了星火医疗大模型 X1,旨在解决医疗咨询中的“建议宽泛不实用”问题。新模型大幅降低了医疗幻觉现象,在复杂问题的回答上能够逐步解释循证过程,提高了逻辑正确性、专业性和可解释性。在诊断推荐、健康咨询和检查检验报告解读等任务上,星火医疗大模型 X1 的效果已超越 GPT-4 和 DeepSeek R1。
该模型已正式应用于 AI 健康助手“讯飞晓医”,并与个人健康档案深度融合。用户在咨询疾病用药时,晓医不仅能够指出正确的用药原则,还能结合用户的既往健康状况,提供更为个性化和详实的处理意见和注意事项。
基于星火 X1 的升级,面向备授课的星火教师助手也进行了优化,提供了更清晰、更详实的 AI 教学思路。具体改进包括:
- 备课时:相比之前的线性流程生成教学设计,现在星火教师助手能更好地理解教师意图,明确教学重难点和目标,并在生成过程中详细说明每一步的逻辑,帮助教师理解和创新。
- 授课过程中:通过显性化呈现思维链,师生可以实时观测认知思维的构建过程,使课堂互动更加直观,有助于探究式课堂的开展。
这些功能已在数学、语文、历史等多个学科中应用,实现了教育教学中 AI 工具的“思维可视化”,从基础问题到复杂问题的解答都有迹可循,进一步促进了教学创新和学生高阶思维能力的培养。
科大讯飞将星火长思维链深度推理技术与法律法规、司法解释及法律专家思维链深度融合,解决了传统大模型存在的知识幻觉问题,提升了证据审查、量刑辅助、裁判观点小编建议等复杂场景所需的法律推理能力。
例如,在裁判观点小编建议场景中,AI 法官助理可以根据卷宗材料小编建议案件事实,逐条分析对比相关法律法规和案例,并输出附有法理依据的裁判观点,为办案提供决策依据。目前,星火大模型的能力已贯穿案情分析、证据审查、庭审提纲辅助生成、裁判辅助等多个环节,助力司法工作的智能化发展。
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected])
近期热点
最新资讯