超乎想象速度的人工智能,正在改变我们的生活。在3月26日国新办举办的发布会上,国家数据局公布了一组特别震撼的数字。今年3月我国日均词元调用量,超过了140万亿。这相对于2024年初,增长幅度多达1000多倍。并且在短短三个月时间里,又迅猛增长了40%。这可不单单只是技术指标的一种跃升,更是中国AI产业进入爆发期的一个明确信号。
在发布会上,国家数据局局长刘烈宏进行介绍指出,截至2025年底的时候,全国已经建成了高质量数据集,数量超过10万个。到今年3月,我国日均词元调用量突破了140万亿大关。那么这个数字究竟意味着什么?它相当于全国14亿人,每人每天都要处理10万个词元。从2024年初的1000亿增长到如今的140万亿,其增长幅度实在是令人咋舌。
词句元素调用数量的急剧加大直接体现了人工智能应用的全面落实。刘烈宏表明,人工智能已经由单纯对话朝着能够进行决策实施的智能个体进行升级,应用层面持续深入。金融范畴的智能投资顾问、医疗领域的辅助诊断操作、律法文书的自动生成过程,都在耗费着数量巨大的词句元素。这一数据说明中国人工智能产业的竞争能力正在明显提高。
据科技日报所报道的,关于全球AI模型聚合平台的最新数据表明,在3月16日至22日这段时间里,全球的总调用量达到了20.4万亿Token,并且环比增长了20.7%。在前十名的榜单当中,中国的AI大模型周调用量达到了7.359万亿Token,相较于前一周出现了暴涨,涨幅为56.9%。而美国的模型在同一时期的调用量为3.536万亿Token,环比仅仅增长了7.35%。
这是中国AI大模型,其一周的调用量连续第三周超越美国。中国AI从追赶者变为领跑者,仅仅用了不到两年的时间。业内人士进行分析,其背后既存在政策大力推动数据集建设的这个因素,也离不开国内企业在算法优化以及应用落地上一直的投入。国产大模型现在在中文理解、垂直场景适配等关键方面已经形成了独特的优势。
大模型训练的领域当中,“垃圾一旦进,产物便出垃圾”堪称铁律。高质量的数据,决定了模型能力的上限所在之处。而AI朝金融、医疗、法律等垂直领域渗透的进程里,通用爬虫所获取产生的公开数据,已不能够满足专业训练所需要求。拥有版权图书、专业期刊、专业行业研报及法律各类文书等为示例的高质量中文语料的公司,稳稳占据着产业链最上游的核心重要位置。
这些企业拥有经清洗标注的高价值词元库,手握此物,变现路径清晰,数据资产入表政策实施后,沉睡的数据被再度定价,数据授权服务有望提供持续的高毛利现金流,这将彻底改变传统传媒出版企业的估值模型,从版权方转变为数据服务商,角色转变带来的是切实的利润增长。
词元数量呈指数级增长,给算力基础设施带来严峻挑战,长文本处理表明模型在推理阶段要处理数百万乃至上千万词元,这直接带动了高性能GPU、AI芯片以及推理服务器的需求,国金证券研报称国产算力全链景气加速,有望量价齐升。
在供需两侧强大逻辑挤压的这种状况下,对2026年进行预计呈现这样的结果,那就是算力产业链将会进入到一种“全链通胀”的周期之中。行业的景气程度将会从核心芯片朝着AIDC、云与算力服务、配套电力设备以及服务器诸如此类的环节进行全面的外溢开来状态。拥有大规模智算中心资源的那些公司,而且还有开发词元压缩算法的企业,均将会迎来业绩释放这样一个时期。算力承载着海量词元吞吐这种情况,它的景气度与词元需求量呈现高度正相关的态势。
处于“词元经济”时期,版权保护以及数据的确权变成产业链能够健康发展的关键保障。大模型于训练以及使用进程当中,极其容易引发版权侵权方面的纠纷。这给版权确权技术与数字水印技术给予了广阔的应用空间。随着法律法规的完备,大模型厂商一定要采购合规的数据。
推出正版,具备授权资源的出版传媒公司,其在价格商议权衡方面的能力,有着明显的提高,呈现出显著提升态势。为大家供给数字版权登记、区块链确定权利服务的相应公司,会收到对于业务增加量的反馈。这些技术可以有效地追踪每个词元的起源以及流动方向途径,对原创作者的权益起到保护作用。在监管变得更加严厉的背景情形之下,符合规定这件麻烦事发成本降低转为核心竞争力属性,相关板块有希望收获市场重新开展的核算作价。
每天平均达到140万亿词元仅仅是一个起始点,当人工智能从实验室迈向众多行业,从具备对话能力演变为能够进行决策并执行,这样一场由词元推动的变革才刚刚开始拉开帷幕,面对中国人工智能模型调用量接连超过美国的这个关键时间点,你觉得接下来哪一个细分领域会最先因这一波爆发式增长而获得好处?欢迎在评论区分享你的看法。