在美中AI大战中,当特朗普选择OpenAI作为战略伙伴时,DeepSeek突然崛起并迅速在全球范围内扩张。它的核心竞争力——“推理模型”仍然依靠英伟达的GPU加速完成,迅速击败了认为英伟达GPU即将被取代的说法。
英伟达官方部落格揭露了DeepSeek-R1模型,它可以让开发团队在保护客户隐私的前提下运行复杂难解的数学和代码,英伟达GeForce RTX 50系列的GPU以每秒3,352兆次运算的速度加速运行DeepSeek推理模型。
推理模型是一种新型的大型语言模型,AI会像人类一样花费时间进行“思考”并对错误做出“反馈”,因此被称为“推理”。就像人类解决问题一样,AI通过更多的思考、理解和反馈来解决问题。推理模型可以理解用户的深层需求,并允许AI对模型的思考过程提供反馈,进一步增强用户体验,并能够解决复杂的多步骤任务,例如市场分析研究、复杂的数学问题或代码等。
DeepSeek推理模型可以在英伟达的RTX AI PC本地快速运行。DeepSeek-R1系列精简模型是基于具有6710亿个参数的大型专家混合(MoE)模型。MoE模型由多个较小的专家模型组成,用于解决复杂问题。DeepSeek模型进一步分配工作并将子任务分配给较小的专家组。
DeepSeek采用一种名为蒸馏的技术,就像制造威士忌一样,可以通过蒸馏技术蒸发掉大部分酒精,留下精华。大型的DeepSeek 6710亿参数模型可以蒸馏出六个较小的学生模型,参数范围从15亿到700亿不等,通过大的DeepSeek-R1 6710亿参数模型将推理能力“传授”给较小的Llama和Qwen学生模型,从而产生功能强大但较小的推理模型,并在英伟达RTX AI PC本地快速运行。
RTX搭载DeepSeek-R1推理模型。英伟达GeForce RTX 50 GPU采用第五代Tensor Core构建,基于相同的Blackwell GPU架构,加速DeepSeek推理模型,为AI PC提供最高的推理效率。
NVIDIA的RTX AI平台提供了广泛的AI工具、软件开发套件和模型选择。目前全球超过1亿台NVIDIA RTX AI PC(包括搭载GeForce RTX 50系列GPU的PC)可以使用DeepSeek-R1的功能。
即使没有网络连接,RTX GPU也可以在低延迟环境下运行,并且可以保护客户隐私,因为用户不需要将敏感个人信息和搜索记录上传到AI服务系统。
风险提示:加密货币投资具有高风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。