DeepSeek的一串“标记”背后：对国产芯片意味着什么？

发布日期：2025-09-09 10:50 点击次数：102

　　“UE8M0 FP8是针对行将发布的下一代国产芯片策划。”

　　这是深度求索公司8月份在新发布新模子DeepSeek V3.1的文档中所留住的一个关键信息。

　　通盘8月下旬，这串“标记”成为国产芯片与算力行业在成本商场狂欢的“资产密码”。关系词，关于非行业专科投资者来说，只消稀里糊涂，很难理会这串略显晦涩的代码到底意味着什么，不错让商场如斯欢跃。

　　“UE8M0 FP8”到底是什么风趣风趣？为什么它能激勉成本商场对国产芯片的高度热心？而咱们又需防备哪些不笃定性？21世纪经济报谈记者采访了数位AI和算力行业东谈主士，并尝试为这三个问题找到一些解答。

　　极致的效果追求

　　最初“UE8M0 FP8”是什么风趣风趣？

　　“FP”即“浮点”，是计较机二进制计较的基础单元，与“INT”整数计较相对应，常以科学计数法抒发数据，适用于图形解决、科学计较、深度学习等诓骗场景。“FP8”即代表8位浮点，依此类推，FP16、FP32永诀代表16位和32位浮点。而每个浮点位又永诀用于记载标记（+、-）、“E”阶数（指数）、“M”余数（少许）等关键数据信息，“通过科学计数法计较的形貌”来记载数据。

　　是以，“UE8M0 FP8”，即代表无标记、8位指数、0位余数的参数要领。

　　一个哀感顽艳的譬如是，“指数位E”是东谈主工智能丈量寰宇的尺的刻度，它既能测量微不雅寰宇的尘埃，也能丈量宏不雅寰宇的江山——然而，它需要标记位和余数“M”来帮它阐发精度。而在主流的参数要领FP8、FP16、FP32等中，其主流参数要领对应的指数位永诀为4位、5位和8位。

　　其中，“FP32”是科学计较、模子教悔和推理的金标准，但因浮点位数高，计较资源奢靡弘大，常用“羼杂”了FP16、FP8的羼杂精度进行高效化替代。

　　而“UE8M0”，就仿佛一个“百招会不如一招鲜”的能手，将我方整个的手段点一皆聚焦到我方的量程之上，由此达到和FP32同样的数据范围。

　　“E8M0是用8位暗意指数部分，余数部分为0，是以Scale（标度）的值范围上和FP32差未几，因为FP32亦然8位暗意指数部分，不错保证量化范围大，故意于模子教悔的数值踏实。”前公共头部数据库企业高管许天（假名）告诉记者：“是以我默契E8M0对比FP32速率更快，对比E5M2类的FP8数值范围更大，教悔更踏实。”

　　天然，隧谈的“UE8M0”，天然会以罢休精度算作代价。然而，由于Transformer架构（一种采取防备力机制的深度学习架构）下的AI大模子，其关键自防备力机制原来就依赖于浮点的广博程，因此 “UE8M0”创造了一种“断送局部精度，相似全局踏实”的东谈主工智能计较要领。

　　“UE8M0 FP8指的是一种为中国商场而非常定制的模子要领，能灵验裁汰计较功耗，基于芯片规格的适度，此要领对中国的芯片厂商比较友好。”Omdia首席分析师苏廉节告诉记者。“比拟之下，国外的厂商是平直采取标准的FP，如E3M4或E5M2等。”

　　为“中国AI+”而生

　　那么“UE8M0 FP8”为何适用于国产芯片？

　　毫无疑问，受制于时间积淀时辰较短，而基于中国标准的算力生态建筑还需完善，因此，国产算力硬件在制程、速率、电耗等标准上存在较大的提高空间。

　　而采取“UE8M0 FP8”要领深度适配国产芯片，并不单是是一项时间上的取舍，更是基于国产芯片的发展近况、履行产业需求以及特定诓骗场景所共同股东的扫尾。本色上是一次用算法调动弥补硬件短板，用生态协同构建自主门道的战术考量。

　　比如，国产芯片在先进制程（如7nm及以下）的制造和封装时间上与国际顶尖水平存在差距，平直影响了芯片的算力密度。主流的矩阵乘法和卷积等编码形貌需要奢靡极大算力以保留精度，而UE8M0的纯指数编码要领，将计较简化为指数移位和加法操作，大幅裁汰了广博算力负荷。

　　与此同期，弥远以来AI领域由英伟达CUDA生态主导，导致国产芯片短暂需要兼容CUDA，且难以充分发达自己硬件秉性，也很难开拓性地成就我方的生态系统。

　　而“UE8M0”算作一种愈加开源、未被单一厂商绑定的要领，可能成为国产芯片重建生态体系的关键。

　　无特有偶，天然将来“UE8M0 FP8”仍然会基于羼杂精度花式驱动话语类大模子诓骗，然而广义的东谈主工智能又绝非“谎话语模子”这样绵薄。比如，在本年事首DeepSeekV2问世之后，不仅东谈主们在糊口之中启动处处使用谎话语模子交互，而且更多的企奇迹单元也对DeepSeek进行土产货化、私有化部署，并通过语料后教悔等用于多样专用用途。

　　事实上，除谎话语模子除外，明确界说的专用用途AI大模子更需具备广博程、高踏实、高效果的算力特质。

　　比如，常被诓骗于自动驾驶和东谈主形机器东谈主具身智能的多模态VLA模子，自大高效计较、大内存带宽和极大动态范围的需求，非常是在解决多模态、大边界数据且部署在计较资源受限的边际开荒时，上风理会；而在工业质检、政务文档解决等场景，常常需要低延长、高准确率的AI模子，何况对成本敏锐。

　　简而言之，在明确界说的专用场景之中，“UE8M0 FP8”大略发达其高效、踏实的特质，在合营羼杂参数精度的情况下，很可能是更顺应“中国速率”，以及千行百业“AI+”的参数要领。

　　属意“不笃定性”

　　天然，这个“UE8M0”背后仍然赋存着不笃定性，如东谈主形机器东谈主精确操作依赖高精度的VLA架构，如原生的汉文谎话语模子，也需要高精度来显得更为“颖悟”。

　　8月以来，跟着DeepSeekV3.1的发布，AI芯片企业寒武纪股价8月涨幅高达110%。

　　长途显示，寒武纪的算力芯片想元590及可能于将来发布的690系列芯片均原生救助FP8计较，而沐曦、燧原等国产AI芯片厂商也均表态其适配FP8计较。

　　8月末，阿里巴巴公司也声称，其行将推出自研的AI算力芯片，何况会适配英伟达的CUDA生态，但未明确其是否适配FP8参数要领。

　　那么，DeepSeek所预言的下一代FP8芯片究竟包摄哪家？21世纪经济报谈记者斟酌多位业内东谈主士之后，仍未获取进一步的信息。记者获取的绝大部分说法是：各家均莫得明确的迹象，显示其使用了“UE8M0 FP8”羼杂参数模子。

　　“我以为这是DeepSeek在向国产芯片行业提议我方的标准，”另一位中资公共化数字科技企业高管告诉记者：“这一逻辑的根源是，DeepSeek还是在中国获取了整个的行业地位和市占率，因此它有才智让芯片厂商左证我方的生态系统去界说芯片策划。”

　　这位不具名高管还向记者泄漏，天然国产芯片对英伟达Hooper架构系列芯片的追逐已初见成效，如寒武纪等公司声称其新品才智在专用场景下的才智达到H100的80%，但跟着英伟达Blackwell系列芯片的推出（其以致采取了FP4的羼杂精度架构），以及特供中国B30a系列芯片的发货，国产芯片追逐国际一流芯片才智上仍有较长的路要走。

　　不外，多数受访众人以为，国内企业芯片最终将获取收效，这需要仰赖其性能具备充分竞争上风。

　　（著述起原：21世纪经济报谈）

海量资讯、精确解读，尽在新浪财经APP

让建站和SEO变得简单

DeepSeek的一串“标记”背后：对国产芯片意味着什么？

热点资讯

相关资讯