Rag - 搜索 News

腾讯网20 小时

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强

中文社区模型（如Qwen系列、GLM-4）在电商场景适应性上表现突出，尤其是在高级电子商务概念上。虽然O1-preview在基本概念上表现更好，但在更高级的概念上面临困难。某些类型的电子商务概念（如相关性概念）仍然对 LLM ...

6 小时

提前免费！百度连发两款模型，我们实测：能听歌看电影，还会蛐蛐人

现阶段，推理模型几乎都采用了一种称为思维链（Chain of Thought，CoT）的技术，与传统的直接从输入到输出的映射不同，思维链通过显式展示中间推理过程，帮助模型更好地理解和解决复杂问题。

腾讯网2 天

医学可用！推理增强RAG：精准诊断、智能补问、高效解析 | WWW 2025

为了解决这些问题，南洋理工大学的研究人员提出了一种新型的知识图谱推理增强的RAG诊断模型MedRAG，结合知识图谱（Knowledge Graph, KG）和大模型推理能力，显著提升智能健康助手的诊断能力，研究成果已被WWW 2025录用。

1 小时

中国企业加速AI部署，昇腾大EP方案成首选，H20遇挑战

春节开工后首月，政务、金融、教育、医疗等千行百业掀起尝鲜浪潮。根据爱分析的统计，截止2月21日，已有约45%的央国企部署了DeepSeek模型。不少企业都是快速买一两台一体机，来体验DeepSeek的效果。这让一体机商机几乎是以往的百倍，呈现井喷 ...

5 天

长文本与RAG技术的较量：阿里通义与港科大提出新框架！

在人工智能的浪潮中，大型语言模型（LLMs）正在改变各个行业的运作方式，特别是在信息检索和生成方面。最近，阿里巴巴通义实验室与香港科技大学以及宾夕法尼亚州立大学的研究团队合作，推出了一个全新的评估框架，旨在比较检索增强生成（RAG）与长文本（Long Context, LCLLM）模型在智能路由决策机制中的表现。这一框架的出台，恰逢LLMs的快速发展，输入长度从最初的4K tokens扩展至如今普 ...

1 小时

多款AI搜索错误率高达60%，别把AI当权威｜合规周报（182期）

本周，我们重点关注一项针对AI搜索准确率问题的最新研究。能检索增强生成（RAG）的大模型一度被认为可以缓解“胡编乱造”的问题，但研究结果显示，AI搜索的错误率依然相当高。此外，我们还关注到多家美国AI巨头“建言献策”，呼吁美国立法允许“合理使用”版权素材；OpenAI Operator 等 AI 智能体成为黑客新武器。

至顶头条 on MSN6 天

Mayo Clinic 对抗 AI 幻觉的秘密武器：反向 RAG 实践

Mayo 诊所采用创新的反向 RAG 技术来解决 AI 模型在医疗领域出现幻觉的问题。该技术将 AI 生成的每个数据点都链接回原始数据源,有效消除了非诊断场景中的数据检索幻觉。这使 Mayo 诊所能够在临床实践中更广泛地应用 AI ...

知乎 on MSN11 小时

如何评价当前的 AI Agent 落地效果普遍不佳的问题？

驱动Agent的是大模型，因此Agent也会继承大模型的“先天不足”。主流的Agent是在大模型的基础上做了一层封装，给了一部分权限和工具，更高级一点的还能外挂一个记忆存储。但这种“缺啥给装啥”的逻辑不是在拟人，更像是弗兰肯斯坦那样的缝合怪。

51CTO6 天

RAG 检索增强之 Reranker 重排序模型详解！

具体来说，ReRanker模型在RAG Pipeline中扮演着第二阶段的角色，即在初始检索步骤之后，对检索出的文档块chunks进行重新排序，以确保相关的文档块优先被传递给LLM进行处理。什么是Reranker模型？ ReRanker模型是对RAG检索返回的结果进行重新排序的模型。也就是下图 ...

红板报 on MSN1 天

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答 ...

淘天未来生活实验室投稿量子位 | 公众号 QbitAI 全面评估大模型电商领域能力，首个聚焦电商基础概念的可扩展问答基准来了！ ChineseEcomQA，来自淘天集团。

来自MSN19 天

当“毛坯房”遇上“精装房”：大模型私有化部署中RAG和Fine Tune的 ...

在人工智能领域中，大模型的私有化部署正在成为企业技术发展的重要方向。然而，选择哪种技术路径才能让大模型在实际应用中发挥最大效用？是RAG，还是Fine Tune？本文将深入探讨这两种技术在大模型私有化部署中的优势与挑战，帮助企业在“毛坯房”与“精装房”之间做出最优选择，实现技术与商业价值的双重提升。 01 一场被按下快进键的AI革命过去一个月，国内掀起了一场本地化大模型部署浪潮。从金融银行到三甲 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果