文章

使用EEG与fNIRS双模态技术揭示AI艺术标签偏见的神经机制

2026-04-16     来源:本站     点击次数:134

一张画两种评价:AI 艺术偏见的脑科学证据
 
引言/背景 
当AI生成的画作在国际艺术比赛中夺冠、在拍卖行以高价成交,一个问题浮出水面:面对一幅画,如果你被告知它出自AI之手,你还会像欣赏人类画作那样去感受它吗?近年来,生成式人工智能在创意领域取得了令人瞩目的进展,AI生成的艺术作品在视觉质量上已经可以与人类创作相媲美。然而,公众对AI创作的接受度和评价却远未跟上技术的脚步。已有研究表明,人们在得知作品由AI生成后,往往会给出更低的评价——即便作品本身完全相同。这种现象被称为“算法厌恶”(algorithm aversion),但其背后的神经机制一直缺乏深入探究。究竟是什么驱动了这种偏见?它仅仅停留在主观评价层面,还是已经深入到大脑的认知加工过程中?

论文概要
近日,华东师范大学团队采用EEG与fNIRS双模态技术,揭示了AI艺术标签偏见的神经机制,成果发表于《Social Cognitive and Affective Neuroscience》,题为“Neural correlates of evaluative bias against artificial intelligence-labeled versus human-labeled artworks”。研究针对现有AI偏见研究缺乏神经证据的局限,控制画作客观一致,仅操控“人类/AI”标签,对125名被试开展行为与神经测试。结果表明,被试对AI标注作品评分显著更低,且人类标注作品可引发更强P300、α波活动及右侧角回与额下回功能连接;对AI态度越积极,偏见越弱。
 

文章信息
 
研究方法
本研究包含两项预注册实验,均采用被试内设计,核心操作在于:所有画作实际上完全相同,但被随机标注为“人类创作”或“AI生成”。参与者在每次试次中先看到标签提示,随后呈现画作,最后从审美价值、创造性、情感表达和整体喜好四个维度对画作进行评分(如图1)。
 
图1 (a) 实验流程示意图(b) AI条件下画作呈现示意图(c) 人类条件下画作呈现示意图
 
实验一(EEG研究)
实验一共招募60名大学生参与。在参与者观看和评价画作的过程中,同步记录脑电信号重点分析画作呈现后的事件相关电位(ERP)成分——特别是P300成分,以及alpha频段(8-13 Hz)的功率谱变化。此外,构建了基于EEG特征的预测模型,用以区分人类标签和AI标签条件下的神经活动模式(如图2)。
 
图2 (a) EEG数据和(b) fNIRS数据的模型构建细节
 
实验二(fNIRS研究)
实验二共招募65名大学生参与,实验范式与实验一类似。使用近红外设备对参与者在评价画作过程中的脑血氧动力学变化进行实时监测。感兴趣脑区包括背外侧前额叶皮层(DLPFC)和角回(AG),研究者分析了各脑区的激活水平,并通过功能连接分析考察了额下回(IFG)与角回(AG)之间的协同活动模式。
 

图3 探头放置位置示意图
 
研究结果 
1.行为学结果
两项实验均一致发现:当画作被标注为“AI生成”时,参与者在多个评价维度上给出了显著更低的评分(如图4)。这一结果在控制了画作本身完全相同的前提下获得,直接证实了标签驱动的评价偏见的存在。此外,参与者对AI的态度(通过问卷测量)能够预测其偏见程度——对AI持更消极态度的参与者,表现出更强的反AI评价偏见。
 
图4 研究1的行为学结果(a) 在四个维度上,人类与人工智能在评分上的差异(b) 人类与人工智能在观看画作时所花费时间的差异(c) 对人工智能的态度对参与者对人工智能创作的艺术品产生的偏见的影响
 
图5 研究2的行为学结果(a) 在四个维度上,人类与人工智能在评分上的差异情况(b) 对人工智能的态度如何影响人们对人工智能创作的艺术品的评价
 
2.EEG结果
在画作呈现后的 P300 时间窗口内,人类标签条件诱发的 P300 波幅显著高于 AI 标签条件(图 6a、6b);P300 作为与注意分配、刺激评估相关的经典 ERP 成分,表明当个体认为作品由人类创作时,会自动投入更多注意资源与认知加工。

人类标签条件下的全脑 α 频段功率也显著更高(图6c、6d);在神经美学与创造性认知研究中,α 波增强通常反映自上而下的内源性注意、深度审美加工与认知参与,提示人们在面对 “人类创作” 标签时会进入更深层的审美与情感加工状态。基于 α 波段活动构建的预测模型显示,人类标签条件下的评分预测效果显著优于 AI 标签条件(图6e),进一步证实两种标签条件下的神经加工模式存在稳定、系统性差异。
 
图6 不同呈现方式(人类操作与人工智能操作)对脑电图活动的影响(a) 显示了与画作同步的FC2频段上的平均ERP波形,图中的曲线反映了P300波形在头皮上的分布情况(b) 显示了人类操作和人工智能操作条件下P300波幅的差异(c) 显示了左右半脑中α波功率的分布情况(d) 显示了人类操作和人工智能操作条件下α波功率平均值的差异(e) 显示了人类操作和人工智能操作条件下预测模型的预测性能差异

3.fNIRS结果
fNIRS结果显示,AG在人类标签条件下的激活水平显著高于AI标签条件(图7b)。角回是默认模式网络的关键节点,主要参与语义加工、记忆整合与情绪联结加工,该结果表明,当被试认为画作由人类创作时,会进行更深入的语义解读与情感共鸣加工。DLPFC激活呈现条件与试验序列的交互效应(图7a),提示审美评价过程中认知控制与决策加工随任务进程发生动态调整。另外,IFG-AG之间的功能连接在人类标签条件下显著增强(图7c)。
 
图7 (a) DLPFC激活的结果,以及顺序和条件对Beta值的影响(b) AG激活的结果,以及顺序和条件对Beta值的影响(c) 各功能区域在四种评分方式中的作用
注:黄色条形表示那些在人类和人工智能两种条件下都能有效预测评分的功能连接,这两种条件之间没有显著差异;红色条形表示那些在人类条件下预测权重明显高于人工智能条件的功能连接;蓝色条形则表示那些在人工智能条件下预测权重明显高于人类条件的功能连接。颜色的深浅反映了两种条件下预测权重差异的大小,颜色越深,差异越大。

结论与展望 
本研究采用两项预注册实验,结合EEG与fNIRS技术,从行为与神经层面系统揭示了艺术作品来源标签引发的评价偏见。行为结果显示,在作品完全相同的情况下,仅标注“AI生成”就会显著降低评价得分,且偏见程度受个体态度调节。神经结果表明,人类标签可引发更强的注意投入与深层认知加工,并增强右侧角回激活及额下回—角回功能连接,支持更充分的语义整合与情感加工。

研究存在一定局限:采用标签操控而非真实创作来源对比,被试主要以大学生为主。未来可拓展真实作品对比、扩大样本范围,并开展纵向追踪,探究偏见随技术普及的变化趋势。
 
原文信息链接
Zhang W, Xie C, Jiang L, Yang L, Hu Z, Hao N. Neural correlates of evaluative bias against artificial intelligence-labeled versus human-labeled artworks. Social Cognitive and Affective Neuroscience, 2025, 20(1): nsaf071.
 
https://doi.org/10.1093/scan/nsaf071
 
作者及团队介绍
该研究由华东师范大学心理与认知科学学院完成;论文第一作者为Wenyu Zhang,其他作者包括Cong Xie、Liuqing Jiang、Li Yang、Zhe Hu。通讯作者为郝宁教授,郝宁教授课题组长期聚焦创造性认知的神经机制、人类与人工智能协同创新、群体创造的脑间互动等前沿方向,综合运用 EEG、fNIRS 等技术开展创造性认知与审美评价的神经基础研究。
 
关于维拓启创
维拓启创(北京)信息技术有限公司成立于2006年,是一家专注于脑科学、康复工程、人因工程、心理学、体育科学等领域的科研解决方案供应商。公司与国内外多所大学、研究机构、企业长期保持合作关系,致力于将优质的产品、先进的技术和服务带给各个领域的科研工作者,为用户提供有竞争力的方案和服务,协助用户的科研工作,持续提升使用体验。

相关产品

 
相关文章 更多 >