首页 > 热点资讯 > 正文

雷军千万年薪挖角95后AI天才少女_95后AI“天才少女”刷屏!雷军千万年薪挖角!

2024-12-30 11:21 来源:网络

雷军千万年薪挖角95后AI天才少女_95后AI“天才少女”刷屏!雷军千万年薪挖角!最近引发大家的关注,相信大家都想知道这件事会有怎么样的发展?下面就让小编为大家介绍一下,一起来看看吧。

雷军千万年薪挖角95后AI天才少女_95后AI“天才少女”刷屏!雷军千万年薪挖角!

95后AI“天才少女”刷屏!雷军千万年薪挖角!

国内自主研发的大模型DeepSeek在全球范围内掀起热潮,同时,一位95后的AI女性天才罗福莉也因此进入公众视线。

近期,中国领先的量化投资公司幻方量化宣布,其下属专注于人工智能大模型研发的部门——深度求索公司,成功推出了DeepSeek-V3的首个版本,并决定开源。该模型作为深度求索自有的混合专家模型(MoE),不仅在性能上与全球顶级模型相匹敌,甚至有所超越,而且以其极低的训练成本受到赞誉,被昵称为AI界的“性价比之王”,吸引了国内外专业人士的广泛关注。

随着DeepSeek的名声鹊起,罗福莉,这位在DeepSeek-V2开发中扮演关键角色的年轻才女,成为了焦点。据报道,小米创始人雷军以高额年薪邀请罗福莉加盟,她将在小米AI实验室领导大模型团队。

DeepSeek-V3的技术报告指出,该模型拥有671B的参数量和37B的激活参数,经过14.8万亿token的预训练。它在多个评估指标上超越了包括阿里Qwen和Meta的Llama在内的开源模型,与GPT-4等封闭模型在性能上不相上下,展示了其低成本高效率的优势。

知名AI专家如前OpenAI联合创始人Andrej Karpathy,对DeepSeek-V3仅使用约280万GPU小时完成训练表示惊叹,相比之下,其他模型的训练时间远超于此。DeepSeek-V3的总训练成本控制在600万美元以下,仅为某些顶级模型成本的十分之一,这种高效性价比赢得了包括Meta AI科学家田渊栋在内的国际认可。

深度求索,这个被誉为“来自东方的神秘力量”,不仅因其技术实力引起轰动,还因其在成本控制上的创新。DeepSeek-V3的开发得益于独特的架构设计,如多头潜在注意力(MLA)和DeepSeekMoE架构,实现了经济高效的训练和推理

DeepSeek通过引领大模型降价潮,成为行业的变革者,国内众多科技企业随后跟进。同时,该公司拥有除互联网巨头外罕见的大量A100芯片储备,为其技术突破提供了硬件支持。

面对为何能成为行业“鲶鱼”的提问,创始人梁文锋表示,DeepSeek的成就源于对技术的专注和早期对算力的大量投资,以及作为量化公司的独特定位,使其能专注于模型研发。

罗福莉的背景同样引人注目,她凭借在AI领域的杰出贡献和学术成就,从北京大学毕业后,先后在阿里巴巴和DeepSeek从事前沿研究,最终被小米高价聘请,显示出她在AI大模型领域的影响力。

小米在AI领域的大举布局,包括罗福莉的加入、成立AI平台部以及增强算力储备,显示了其在AI战略上的决心,特别是寻求在成本控制和技术创新间找到平衡点,这也映射了小米一贯的“性价比”策略。罗福莉的加入,无疑为小米的AI之路增添了重量级的推动力。

关于雷军千万年薪挖角95后AI天才少女_95后AI“天才少女”刷屏!雷军千万年薪挖角!的内容小编就阐述到这里了,希望本篇的信息能够解答大家目前的疑问,想要更多最新的内容记得关注多特软件站哟!

了解更多消息请关注收藏我们的网站(news.duote.com)。

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected]