从观察结果来看,在推理 - 行动困境中,LRM 表现出了一致的行为模式,即倾向于内部模拟而不是环境交互。它们会耗费大把时间来构建复杂的预测行动链,而不是适应实际的系统响应。研究者将这种现象称为过度思考。