CODER - 搜索 News

1 天

近年来，大型语言模型（LLMs）在代码相关的任务上展现了惊人的表现，各种代码大模型层出不穷。这些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。除了预训练外，一些通过 instruction 数据对 LLM 进行 post ...

腾讯网3 天

新型 AI 文本扩散模型突破速度瓶颈，从噪声中提取文字

周四，Inception Labs 发布了 Mercury Coder，这是一款采用扩散技术生成文本的新型 AI 语言模型。与传统的逐字生成文本的模型（如 ChatGPT 所使用的）不同，Mercury ...

3 天

Mercury：首个商用级别的Diffusion LLM，速度快、手机也能部署

Mercury 系列的首款产品 Mercury Coder，已在公共测试中亮相。该模型专注于代码生成，展现了出色的性能，并且在多个编程基准测试中超越了许多现有的速度优化模型，如 GPT-4o Mini 和 Claude3.5Haiku，同时在速度上也快了近10倍。根据开发者反馈，Mercury 的代码完成效果更受欢迎，在 C o p i l o t Arena 的测试中，Mercury ...

4 天

不要自回归！扩散模型作者创业，首个商业级扩散LLM来了，编程秒出 ...

如此高效且达到商业级的新型语言模型自然吸引了不少关注，著名 AI 研究科学家 Andrej Karpathy 发帖阐述了这项成果的意义。他表示，不同传统的自回归 LLM（即从左到右预测 token），扩散模型是一次性向所有方向进行预测 —— ...

格隆汇 on MSN6 天

法本信息(300925.SZ)：自2023年12月起接入DeepSeek模型并进行微调优化

格隆汇2月25日丨法本信息(300925.SZ)在投资者互动平台表示，公司敏锐捕捉AI技术机遇，自2023年12月起接入DeepSeek模型并进行微调优化，从DeepSeek ...

14 天

DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升！

CODEI/O训练之后，Qwen-Coder在代码理解任务上取得了突破性进展，并且在阅读理解和推理任务（如DROP）上也有明显提升，这表明通过代码训练获得的推理能力确实迁移到了其他领域。

14 天

【AI编程炸裂玩法】DeepSeek加持OpenCV实验大师开启图像算法代码自动 ...

作者实践经验证明结合这两个工具，通过OpenCV实验大师工作流的精准专业提示词以后，DeepSeek Code Lite 14B模型生成的代码无论是C++ 还是Python语言，几乎都不用修改，直接使用。

14 天

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞

结果显示，总体得分相似，但输入预测在KorBench上表现出色，同时略微影响了GPQA的表现；而输出预测在BBH等符号推理任务上显示出更大的优势。CRUXEval-I和-O分别偏向于输入和输出预测。

搜狐22 天

DeepSeek-Coder When the Large Langua

《DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence》由Daya Guo等人撰写。论文介绍了DeepSeek-Coder系列开源代码模型，通过创新的训练方法和大规模数据训练，在代码智能领域取得了显著成果。 1. 背景与挑战：大语言模型推动代码智能化 ...

51CTO25 天

开启国产深算智能新时代， DeepSeek系列模型上线国家超算互联网

据国家超算网互联网消息，目前DeepSeek-R1、V3、Coder等系列模型已登陆超算互联网平台，涵盖了目前火爆的从1.5B到14B的蒸馏模型伴随DeepSeek系列模型上线国家超算互联网平台（www.scnet.cn），一个基于国产深算智能加速卡的普惠、可靠AI大模型时代正悄然降临。

IT之家26 天

DeepSeek 在网文领域首次应用，阅文“作家助手”升级三大辅助创作功能

IT之家2 月 5 日消息，阅文集团今日宣布，旗下作家辅助创作产品“作家助手”应用已集成独立部署的 DeepSeek-R1 大模型，据称这也是 DeepSeek 首次在网文领域应用。据介绍，此次作家助手集成 DeepSeek-R1 大模型后，将在智能问答、获取灵感和描写润色三方面得到 ...

凤凰网26 天

DeepSeek进入“国家队”，超算互联网上线R1/V3/Coder等系列模型

IT之家 2 月 5 日消息，据“超算互联网”公众号，DeepSeek-R1、V3、Coder 等系列模型，已陆续上线国家超算互联网平台。国家超算互联网平台已正式上线 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果