“DeepSeek非常专注和纯粹,只专注于底层大模型的研发,不涉足行业应用,也不考虑短期变现,充满了极客精神。”科大讯飞董事长刘庆峰在接受采访时说,“我们都很羡慕这样的极客,因为科大讯飞需要在行业中落地,并确保自我造血。”
刘庆峰认为,DeepSeek的意义不仅在于其技术创新,更在于增强了中国各阶层人士对本国自主创新的信心。尽管DeepSeek的创新主要体现在工程优化层面,但人工智能的持续发展还需要在基础源头技术上进行更多探索。
DeepSeek的成功带火了能生成“思维链”、模拟人类思考方式的推理模型。科大讯飞也在1月15日发布了星火深度推理模型X1,声称是当前唯一基于全国产算力训练的具备深度思考和推理能力的大模型。
刘庆峰回顾道,2024年10月,科大讯飞完成了深度推理模型的技术路线验证。然而,为了适配国产算力平台,他们不得不额外花费两个月时间进行调整。使用国产AI芯片的成本更高,训练时间也更长,这拖慢了模型发布的进度。不过,从国家和产业龙头公司的角度看,必须有一批企业在国产算力平台上进行大模型训练,以推动工具链的设计和发展。
刘庆峰提到“龙芯”cpu的历史教训:21世纪初,中国科学院自主研发出“龙芯1号”,这是中国第一款商用的通用CPU芯片,性能接近英特尔CPU,但由于缺乏应用支持,未能跟上国际步伐。为了避免重蹈覆辙,刘庆峰呼吁企业更多地在自主可控的平台上做模型训练,而不仅仅是简单地进行推理或微调。
他强调:“若不能加快解决国产自主可控人工智能产业生态薄弱、适配困难等问题,无异于‘在别人地基上建高楼’。”因此,他建议对使用国产算力芯片的企业给予资金专项支持,在国家公共算力上给予资源倾斜,加速基于国产算力的大模型算法创新。此外,鼓励央国企优先采购基于国产算力平台研发的全栈自主可控大模型,并优先推广这些模型的行业垂直应用。
今年,中国将发布人工智能教育白皮书。社会层面上,“AI+教育”的实施早已启动。成都市教育局遴选了35所中小学开展“AI+教学”试点,探索人工智能赋能学习和教学方式的变革。北京市教委也发布了《北京市教育领域人工智能应用工作方案》及《北京市教育领域人工智能应用指南》。
刘庆峰认为,AI大模型可以成为教师的有效助手,帮助因材施教,提高教学质量,减少学生无效重复的学习时间,并增强学生的自信心。尽管AI掌握大量知识,但它无法取代教师的角色。教师在培养学生价值观、同理心、创造力等方面的作用不可或缺。
除了教育,医疗也是科大讯飞大模型行业落地的重要方向。科大讯飞推出了面向大众的AI健康助手“讯飞晓医”,并计划在深圳龙华区建设面向医生的AI诊疗助理。百川智能也将公司重心投入医疗场景,参与了北京儿童医院的首次“AI儿科医生+多学科专家”双医并行多学科会诊。
对于AI在医疗场景中的定位,业内存在争议。有医生认为,DeepSeek等大模型可以帮助患者了解疾病基础知识,但在治疗和用药信息方面仍需听取专业医生的建议。刘庆峰表示,AI应成为医生的助手,而不是替代医生。例如,当发现医生的电子病历可能有遗漏或错误时,AI系统可以自动提醒。
为避免“AI+医疗”应用场景的混乱,刘庆峰建议尽快出台相应的规范指引,设立准入门槛,明确测试标准和负责机构,确保医疗安全和质量。
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:rjfawu@163.com)
近期热点