首页 > 热点资讯 > 正文

DeepSeek彻底爆发_彻底爆发!DeepSeek火了!服务器都崩了

2025-01-27 13:53 来源:网络

最近DeepSeek彻底爆发_彻底爆发!DeepSeek火了!服务器都崩了事件在热度非常高,为大家准备了完整关于DeepSeek彻底爆发_彻底爆发!DeepSeek火了!服务器都崩了事件的所有相关内容,如果大家想知道更多这方面的情况,请持续关注本站!

DeepSeek彻底爆发_彻底爆发!DeepSeek火了!服务器都崩了

彻底爆发!DeepSeek火了!服务器都崩了

### 源自券商中国

#### 热度突然飙升!

这个周末,无论是科技界还是投资界,都在热议DeepSeek。本周,中国人工智能公司DeepSeek发布了其R1模型(DeepSeek R1),引发了硅谷的紧张情绪。根据第三方基准测试,该模型的表现优于OpenAI、Meta和Anthropic等美国领先的人工智能公司。

DeepSeek的性能令人印象深刻,尤其是在文学素养和文字组织能力方面,已经超越了许多专业文字工作者,引发了一种职业危机感。此外,它在阅读总结能力和数理逻辑处理方面也表现出色。更重要的是,DeepSeek R1的成本优势极为明显,市场因此认为英伟达周五的大跌与DeepSeek的火爆有关,因为DeepSeek的成功可能削弱了市场对英伟达AI芯片需求的预期。

#### DeepSeek的冲击

我国人工智能研究人员实现了许多人认为遥不可及的目标:一个免费的开源人工智能模型,其性能可以匹敌甚至超过OpenAI最先进的推理系统。更令人惊奇的是他们如何做到这一点:让人工智能通过反复试验自学,就像人类学习一样。

春节前的一周,DeepSeek发布了其R1模型,引起了硅谷的高度关注。在AIME2024数学基准测试中,DeepSeek R1的成功率达到79.8%,超过了OpenAI的o1推理模型。在标准化编码测试中,它表现出“专家级”的性能,在Codeforces上获得了2029Elo评级,并超越了96.3%的人类竞争对手。

然而,DeepSeek R1真正与众不同之处在于其成本极低。该模型每百万个token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,便宜了98%。与专有模型不同,DeepSeek R1的代码和训练方法在MIT许可下完全开源,这意味着任何人都可以获取、使用和修改该模型,而不受限制。

#### 扎克伯格的反应

针对人工智能差距快速缩小的情况,Meta创始人兼CEO扎克伯格呼吁美国政府加紧封锁。他表示,DeepSeek非常先进,中美AI差距非常小。扎克伯格近日表示:“我们应该希望美国的模型能赢,中国正在全力冲刺。如果将来有一个开源模型能被全世界广泛使用,我们希望它是一个美国模型。”

他进一步指出,如果美国政府能够更多地支持美国公司,而不是在每个环节都拖后腿,那就更好了。美国科技行业现在确实是领先的,所以政府偶尔添点麻烦,美国科技行业也许依然能保持领先。但政府不应把这种领先地位当成理所当然的事,而是应该提供帮助。DeepSeek发布几天后,Meta计划在2025年投入超过600亿美元,加大对人工智能的投入。

但对于Meta的首席人工智能科学家Yann LeCun来说,DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁,而是保持人工智能模型开源的价值,以便任何人都能受益。LeCun在社交媒体Threads上的一篇文章中表示:“并不是中国的人工智能‘超越了美国’,而是‘开源模型正在超越专有模型’。”LeCun强调,DeepSeek“受益于开放研究和开源”,并指出“这就是开放研究和开源的力量”。

#### 英伟达受冲击?

另一类着急的人可能是英伟达的多头。周五收盘,英伟达股价大跌超3%,盘后继续跌0.42%。市场认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期。因为DeepSeek似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这让人质疑投入芯片行业的数千亿美元资本支出的实际效用。

DeepSeek仅用2048颗英伟达H800 GPU和560万美元,就训练出了6710亿参数的开源大模型,这只是OpenAI和谷歌训练同等类型模型花费的一小部分。加州大学伯克利分校人工智能政策研究员里特维克·古普塔表示,DeepSeek最近发布的模型表明,“没有阻碍人们获取人工智能能力的壕沟”。他说:“训练模型的第一人必须花费大量资源才能实现目的,但跟进者可以用更少的费用且以更快的速度实现目的。”

另一方面,苹果研究员Awni Hannun提到,人们可以在Apple Mac上本地运行该模型的量化版本。传统上,由于与英伟达的CUDA软件不兼容,苹果设备在AI方面一直较弱,但这种情况似乎正在改变。例如,AI研究员Alex Cheema在利用8台Apple Mac Mini设备共同运行后能够运行完整模型,这仍然比运行目前最强大的AI模型所需的服务器便宜。也就是说,用户可以在Apple Mac上运行更轻量的DeepSeek R1版本,并获得良好的准确度和效率。

总之,DeepSeek的发布不仅展示了中国在人工智能领域的强大实力,还推动了全球开源AI的发展,给硅谷带来了新的挑战

以上内容就是小编为大家整理的DeepSeek彻底爆发_彻底爆发!DeepSeek火了!服务器都崩了全部信息,如果大家还想了解更多后续或相关内容,请关注多特软件站,持续更新给大家带来最新消息!

了解更多消息请关注收藏我们的网站(news.duote.com)。

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected]