投资 >

成本差异铸成AI鸿沟？牛津：汉语训练费用是英语的2倍

2023-07-31 16:07:49 来源：金融界

【资料图】

如今的大型语言模型（LLM）可以理解世界上很多语言，甚至是一些记载较少的语言。不过，大模型处理不同语言之间时，其性能上存在很大的差异，这是由于模型成本与其所训练的语言紧密挂钩。

牛津大学最近进行的一项研究表明，从诸多语言模型的计费方式看，英语的输入和输出比其他语言的输入和输出要便宜得多。例如，西班牙语的成本约为英语的1.5倍，简体中文的价格约为2倍以上，缅甸掸语在15倍以上。

成本的差异也间接导致英语使用者和世界其他语言使用者之间形成AI鸿沟。

成本差异主要是因数据标记化所带来的。标记化就是将训练文本分解成更小的单元，这个更小的单元就是标记（Token）。这是一个人工智能（AI）公司将用户输入转换为计算成本的过程。

研究显示，使用英语以外的语言访问和训练模型的成本都更高。例如中文，无论是在语法上还是在字符数量上，都有更复杂的结构，从而导致更高的标记化（Token）率。

举例来看，基于OpenAI公司的GPT2模型，对于“国家不同，所得税的结构是不同的，税率和税率等级也有很大的差异”这句话的处理来看，在简体中文处理中运用到了66个Token，在英语处理中仅用到了24个Token，而在禅语处理中使用到了468个Token。

就每次输出所需的费用而言，汉语的成本是英语的两倍。所以在AI相关的费用中，英语的成本效益是最高的。

当涉及到语言模型时，设计者的主要目标是实现低成本和高效功能之间的平衡。随着AI领域的不断发展，科技公司必须仔细考虑语言选择对成本和可访问性的影响。

这种成本差异促使中国、印度等国家纷纷开发自己的母语LLM项目。

本文源自：金融界

标签：

上一篇： 农业农村部：7月31日全国农产品批发市场猪肉平均价格为20.81元/公斤比上周五上升4.8%
下一篇： 最后一页

成本差异铸成AI鸿沟？牛津：汉语训练费用是

投资

如今的大型语言模型（LLM）可以理解世界上很多语言，甚至是一些记载较

2023-07-31

农业农村部：7月31日全国农产品批发市场猪

投资

据农业农村部监测，7月31日"农产品批发价格200指数"为118 36，比上周五

2023-07-31

专访中手游冼汉迪：IP是一种文化标签，其背

投资

在经历2022年的营收下滑后，2023年中国游戏市场渐趋回暖，但在获客成本

2023-07-31

北京发布分区暴雨红色预警，部分地区降级发

投资

北京市气象局消息，本市强降雨持续，北京市气象台发布分区域暴雨红色预

2023-07-31

日本全国平均最低时薪将首超1000日元

投资

据日经中文网，日本中央最低工资审议会（厚生劳动相的咨询机构）日前决

2023-07-31

精彩阅读财富科技金融快讯企业

成本差异铸成AI鸿沟？牛津：汉语训练费用是英语的2倍

投资

如今的大型语言模型（LLM）可以理解世界上很多语言，甚至是一些记载较

2023-07-31

农业农村部：7月31日全国农产品批发市场猪肉平均价格为20.81元/公斤比上周五上升4.8%

投资

据农业农村部监测，7月31日"农产品批发价格200指数"为118 36，比上周五

2023-07-31

专访中手游冼汉迪：IP是一种文化标签，其背后是受众群体的文化认同

投资

在经历2022年的营收下滑后，2023年中国游戏市场渐趋回暖，但在获客成本

2023-07-31

北京发布分区暴雨红色预警，部分地区降级发布暴雨橙色预警

投资

北京市气象局消息，本市强降雨持续，北京市气象台发布分区域暴雨红色预

2023-07-31

日本全国平均最低时薪将首超1000日元

投资

据日经中文网，日本中央最低工资审议会（厚生劳动相的咨询机构）日前决

2023-07-31

高盛：油市转向供应短缺明年二季度油价将升至93美元

投资

智通财经APP获悉，“大宗商品旗手”高盛表示，市场已经摆脱了对增长的

2023-07-31

A股零售板块午后持续拉升走强中央商场、国芳集团涨停

投资

7月31日，A股零售板块午后持续拉升走强，通程控股、中央商场午后双双涨

2023-07-31

周茂华：7月制造业市场需求和景气度改善，国内物价有望企稳回升

投资

国家统计局31日发布2023年7月中国采购经理指数运行情况显示，7月份，制

2023-07-31

上海第二批供地下半场将于8月1日起拍 9宗地、总起价220亿元

投资

悉，此次交易包含9幅涉宅地块，起始总价达220 23亿元，现场交易会将在2

2023-07-31

民银研究：7月非制造业景气度回落至年内最低水平，制造业景气度则持续改善

投资

7月非制造业景气度回落至年内最低水平，制造业景气度则持续改善。

成本差异铸成AI鸿沟？牛津：汉语训练费用是英语的2倍

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

2023-07-31

网站介绍