本文提出了一种名为指令对比解码(Instruction Contrastive Decoding,ICD)的方法,旨在减少LVLM推理过程中的幻觉。ICD的灵感来自于我们观察到所谓的干扰指令显著加剧了多模态融合模块中的幻觉。ICD通过对比标准指令和干扰指令下的分布,从而增加对齐不确定性 ...
在 NeurIPS 2024 大会上,OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 在其主题报告中展望了基础模型的未来研究方向,其中包括了 Inference Time Compute ...
4 天
中国教育在线 on MSNAI4S再突破!复旦团队让RNA分析不再“开盲盒”“RNA有很多家族,此前在解析RNA结构时,科研人员往往不确定应该选择哪些序列进行解析。”复旦大学智能复杂体系实验室研究员、文章共同通讯作者孙思琦解释道, “这就像开‘盲盒’,我们只能猜测哪些家族的序列可能具有稳定的结构。” ...
在 NeurIPS 2024 大会上,OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 在其主题报告中展望了基础模型的未来研究方向,其中包括了 Inference Time Compute [1],即增强模型在推理阶段的能力,这也是 OpenAI o1 和 o3 等核心项目的关键技术路径。
5 天
知乎专栏 on MSN添加各种trick训练出来的SigLIP2这个论文有很多干货,整合了前几年各领域的经典trick,做了很多实验。 为了得到一个更好的backbone,把能用到的loss、能添加的辅助任务都用上了: CLIP的图文对比lossLocCa的caption loss类MAE的重建loss ...
在人工智能领域持续突破的浪潮中,Qwen 团队最新发布的模型 QwQ-32B,以 320 亿参数规模,再次刷新行业对开源大模型的认知。该模型在代码生成、多轮对话等任务中展现出了卓越的表现,推理能力更是比肩满血版 DeepSeek-R1。此前不久,专为大模型加速推理的 vLLM ...
阿里妹导读通过本篇文章,你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。一、省流版简介通过本篇文章,你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流,本文所有操作环境和硬件都基于公司所发工作电脑,模型都基于网络开源,无需自己训练调参。(不过如果你有更强 ...
MuCST 算法为解决空间转录组数据整合的难题提供了一种创新的解决方案。它通过多模态对比学习,不仅能够有效整合组织学图像和空间转录组数据,还能减轻多模态数据的噪声和异质性影响,精确识别空间域,揭示肿瘤异质性,并对数据进行降噪处理。这使得研究人员能够更深入地理解组织的结构和功能,为疾病的诊断和治疗提供更有力的支持。
传统的RNA结构解析方法面临实验成本高昂、预测精度不足等难题。冷冻电镜虽然能够解析高分辨率结构,但要筛选出能够形成稳定构象的RNA序列,仍然需要耗费大量资源。此外,现有算法还依赖于Rfam数据库等二级结构信息。 “RNA有很多家族,此前在解析RNA结构时,科研人员往往不确定应该选择哪些序列进行解析。”复旦大学智能复杂体系实验室研究员、文章共同通讯作者孙思琦解释道,“这就像开‘盲盒’,我们只能猜测哪 ...
相关研究成果以“Multi-Scale Hyperbolic Contrastive Learning for Cross-Subject EEG Emotion Recognition”为题发表在IEEE Transactions on Affective Computing期刊上。 该工作得到 ...
9 天
一点资讯 on MSN喜讯!西电计科院多篇论文成果被国际顶级会议录用近日,西安电子科技大学计算机科学与技术学院多篇论文成果分别被国际顶级会议SIGMOD、VLDB、CVPR、ICLR、WWW、ICDE录用。其中,智能媒体与数据工程研究所6篇论文分别被国际会议SIGMOD、VLDB、CVPR、ICLR、ICDE录用,计 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果