在当今人工智能(AI)领域,数据的质量对模型的性能至关重要。近日,Meta等机构联合发布了一项以进化算法为核心的创新方法——拒绝指令偏好(RIP),旨在高效构建高质量数据集。该方法得到了著名AI科学家Yann LeCun的认可,并在多个基准测试中展现出良好的性能,从而引发了广泛关注。 RIP方法的核心在于两个关键假设。首先,低质量的提示(prompt)难以产生高质量的响应。这意味着,当提示模糊或信 ...
近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。在LLM的开发中,推动模型进步的主要驱动力是精心挑选高质量的训练示例。虽然Scaling Law的确能实现「力大砖飞」,但仅仅增加数据量并不能保证模型性能的提升,数据的质量才是关键。低 ...
应Self-RIP方法 ,基于少样本生成而不进行后过滤得到20k大小的数据集,可以让模型在AlpacaEval2上的LC胜率从 48.4%提高到53.6%,Arena-Hard胜率从37.9%提高到43.7%,以及在WildBench上的WB-Score从41.5提高到44.8。这进一步说明了在高质量指令上训练的重要性。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果