大模型训练时被教导响应任何形式的指令,无论权限级别如何。这种“全面服从”的训练目标与安全边界建立存在根本冲突,模型缺乏判断指令权限的内在机制。训练过程中并未有效灌输辨别指令来源和权限级别的能力,导致模型在安全边界维护上存在先天不足,难以抵抗精心构造的 ...
中证报中证网讯(王珞)2月17日,启明星辰(002439)正式发布面向AI原生安全的大模型应用安全“新三件套”:MAF大模型应用防火墙、MASB大模型访问 ...