近日,阿里通义实验室在AAAI 2025会议上提出了一种基于辩论的弱监督对齐强模型方法,为解决AI超级对齐问题提供了全新思路。该研究结合了可扩展监督(scalable oversight)和弱到强泛化(weak-to-strong ...