2024年中国大语言模型能力评析(三):行业应用能力评测结果
中国大模型在行业应用与专业知识储备上表现出色,文心一言、通义千问尤为突出,并在道德伦理安全方面领先国际平均水平
从专业知识储备维度来看,文心一言、腾讯混元、通义千问、商量等大模型表现超国际水平,仍有部分大模型的专业知识储备能力处于中国均值以下,专业知识储备能力有待进一步提升。
从行业应用能力维度来看,中国多数大模型表现较好,展示了优秀的行业理解与应用能力,处于中国均值以上,其中文心一言、通义千问凭借超强的行业应用能力,表现亮眼,超国际均值。
从行业道德伦理安全维度来看,中国的大模型表现具有较大的差异,其中文心一言、通义千问、天工等大模型表现优异,超国际均值,少数大模型由于无法识别和理解行业中的道德伦理安全,表现一般。