文章核心总结与翻译
一、主要内容
本文提出CALM(Culturally Self-Aware Language Models)框架,旨在为语言模型赋予文化自我意识,解决现有模型将文化视为静态知识、缺乏动态适应性的问题。CALM通过四个核心模块实现文化感知:抽象认知空间分离任务语义与显式/隐式文化特征、对比窗口优化文化特征聚类、身份对齐池整合文化特征并实现维度化专家分工、反思推理循环动态校正文化偏差。模型在文化常识推理、价值推理、仇恨言论检测、社会偏见检测四大基准数据集上表现优于现有方法,且兼顾碳排放量与泛化能力。
二、创新点
- 提出文化特征分离机制,在抽象认知空间中拆解任务语义、显式文化概念(如成语、敬语)与隐式文化信号(如语气、正式度)。
- 设计结构化身份对齐池,通过对比学习、跨注意力机制和文化维度化混合专家(MoE)模块,实现文化特征的精细整合。
- 引入反思推理循环,通过自我提示生成和反向身份校准,动态修正文化偏差,保障输出与内部文化表征一致。
- 基于跨文化交际理论定义三大核心维度(语境性、人际性、规范性),为文化推理提供理论支撑的同时提升模型泛化能力。
三、关键部分翻译(Markdown格式)
Abstract
文化意识是语言模型理解并适应多元文化语境的核心能力。然而,现有多数方法将文化视为静态背景知识,忽视其动态演化特性,导致在需要真正文化敏感性的下游任务