切换到宽版
  • 10阅读
  • 1回复

[数码讨论]“Token”中文名定了:词元 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
236457
金币
816785
道行
2006
原创
2459
奖券
3500
斑龄
44
道券
1548
获奖
0
座驾
设备
摄影级
在线时间: 50402(小时)
注册时间: 2008-10-01
最后登录: 2026-03-25
只看楼主 倒序阅读 楼主  发表于: 3小时前

IT之家 3 月 24 日消息,据央视新闻报道,昨日在中国发展高层论坛 2026 年年会上,国家数据局局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。

这从官方角度给出了 Token 的中文翻译:“词元”。

据IT之家了解,在人工智能系统中,词元是模型处理信息的最小单元。无论是用户输入的查询请求,还是系统生成的程序代码,均需拆解为词元进行运算处理。因此,词元调用量不仅反映模型的使用活跃度,更是评估人工智能产业实际价值创造能力的重要指标。

刘烈宏透露,截至 2025 年 3 月,我国日均词元调用量已攀升至 140 万亿次以上,这一数字较 2024 年初的 1000 亿次实现千倍跃升;即便与 2025 年底的 100 万亿次相比,短短三个月内增幅亦超过四成。

刘烈宏指出,今年 1 月底以来,有的模型企业创下 20 天收入超越 2025 年全年总收入的业绩纪录。这组数字背后,是一套以 Token 计费为基础的新型商业逻辑正在加速演进。

刘烈宏对此评价称,调用量的急剧攀升反映出我国人工智能产业已迈入高速发展通道。随着应用场景从对话交互向决策执行型智能体纵深演进,中国人工智能产业的竞争力在显著增强,现在备受关注的 Token 出海,就是产业竞争力增强的一个标志。

在数据资源层面,我国高质量数据集建设已取得阶段性成果。截至 2025 年底,全国已建成高质量数据集逾 10 万个,存储规模突破 890PB,体量相当于中国国家图书馆数字资源总量的 310 倍。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
236457
金币
816785
道行
2006
原创
2459
奖券
3500
斑龄
44
道券
1548
获奖
0
座驾
设备
摄影级
在线时间: 50402(小时)
注册时间: 2008-10-01
最后登录: 2026-03-25
只看该作者 沙发  发表于: 3小时前
关于国家数据局局长刘烈宏在中国发展高层论坛 2026 年年会上关于 Token 相关观点的解读
“词元”作为 Token 中文翻译的意义
国家数据局局长刘烈宏给出 Token 的中文翻译“词元”,从官方角度明确了这一在人工智能领域关键概念的表述。在人工智能系统里,“词元”是模型处理信息的最小单元,这一精准定义有助于国内行业在交流、研究和发展过程中,使用统一、规范的术语,减少因概念模糊带来的沟通障碍,促进人工智能领域知识的高效传播和技术的协同发展。
词元调用量反映的产业情况
调用量的增长态势
截至 2025 年 3 月,我国日均词元调用量已攀升至 140 万亿次以上,与 2024 年初的 1000 亿次相比实现了千倍跃升,即便和 2025 年底的 100 万亿次相比,短短三个月内增幅也超过四成。如此迅猛的增长速度,直观地展现出我国人工智能产业在近期的爆发式发展态势。词元调用量的急剧增加,意味着人工智能模型在各个领域的应用越来越广泛,用户对人工智能服务的需求呈现出快速增长的趋势。
调用量与产业价值的关系
词元调用量不仅是模型使用活跃度的体现,更是评估人工智能产业实际价值创造能力的重要指标。随着调用量的不断攀升,说明人工智能模型在实际应用中发挥了更大的作用,为企业和社会创造了更多的价值。例如,在智能客服领域,大量的词元调用意味着能够处理更多的用户咨询,提高客户满意度,降低企业的人力成本;在智能医疗领域,词元调用量的增加可能意味着能够辅助医生进行更多的疾病诊断和治疗方案制定,提高医疗效率和质量。
以 Token 计费为基础的新型商业逻辑
今年 1 月底以来,有的模型企业创下 20 天收入超越 2025 年全年总收入的业绩纪录,这背后是一套以 Token 计费为基础的新型商业逻辑正在加速演进。以词元(Token)计费的方式,使得人工智能服务的收费更加精准和透明。企业可以根据实际使用的词元数量来支付费用,避免了传统收费模式中可能存在的不合理之处。同时,这种商业逻辑也激励模型企业不断提高模型的性能和效率,降低词元的使用成本,从而吸引更多的用户使用其服务,形成良性循环。
我国人工智能产业竞争力增强
产业发展阶段判断
刘烈宏评价称调用量的急剧攀升反映出我国人工智能产业已迈入高速发展通道。随着应用场景从对话交互向决策执行型智能体纵深演进,我国人工智能产业不再局限于简单的问答交互,而是能够参与到更复杂的决策和执行过程中。例如,在自动驾驶领域,人工智能系统需要根据实时的路况信息做出决策,控制车辆的行驶;在智能制造领域,人工智能可以实现对生产过程的智能调度和优化。这些应用场景的拓展,标志着我国人工智能产业在技术水平和应用能力上取得了重大突破。
Token 出海的意义
现在备受关注的 Token 出海,是我国人工智能产业竞争力增强的一个标志。Token 出海意味着我国的人工智能技术和产品得到了国际市场的认可,能够在全球范围内与其他国家的企业进行竞争。这不仅有助于我国人工智能企业拓展海外市场,增加收入来源,还能提升我国在全球人工智能领域的话语权和影响力。通过与国际市场的交流和合作,我国人工智能企业可以吸收国外先进的技术和经验,进一步推动自身的发展和创新。
数据资源层面的成果
高质量数据集建设情况
在数据资源层面,我国高质量数据集建设已取得阶段性成果。截至 2025 年底,全国已建成高质量数据集逾 10 万个,存储规模突破 890PB,体量相当于中国国家图书馆数字资源总量的 310 倍。高质量的数据集是人工智能模型训练的基础,丰富的数据资源能够为模型提供更多的学习样本,提高模型的准确性和泛化能力。我国在高质量数据集建设方面取得的成果,为我国人工智能产业的发展提供了有力的支撑。
数据资源对产业发展的推动作用
随着数据资源的不断积累和丰富,我国人工智能产业将迎来更广阔的发展空间。一方面,更多的数据可以用于训练更强大的人工智能模型,推动人工智能技术在各个领域的应用和创新;另一方面,数据资源的共享和开放可以促进产业内的合作和交流,形成良好的产业生态。例如,不同企业之间可以共享数据集,共同开展研发项目,加速人工智能技术的突破和应用。

综上所述,国家数据局局长刘烈宏在中国发展高层论坛 2026 年年会上的讲话,全面展示了我国人工智能产业在词元定义、调用量增长、商业逻辑演变、产业竞争力提升以及数据资源建设等方面取得的显著成就。这些成就为我国人工智能产业的未来发展奠定了坚实的基础,也让我们对我国人工智能产业的前景充满信心。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个