CODER - 搜索 News

5 天

如此高效且达到商业级的新型语言模型自然吸引了不少关注，著名 AI 研究科学家 Andrej Karpathy 发帖阐述了这项成果的意义。他表示，不同传统的自回归 LLM（即从左到右预测 token），扩散模型是一次性向所有方向进行预测 —— ...

2 天

微软原WizardLM团队：代码大模型WarriorCoder，性能新SOTA

近年来，大型语言模型（LLMs）在代码相关的任务上展现了惊人的表现，各种代码大模型层出不穷。这些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。除了预训练外，一些通过 instruction 数据对 LLM 进行 post ...

腾讯网3 天

新型 AI 文本扩散模型突破速度瓶颈，从噪声中提取文字

周四，Inception Labs 发布了 Mercury Coder，这是一款采用扩散技术生成文本的新型 AI 语言模型。与传统的逐字生成文本的模型（如 ChatGPT 所使用的）不同，Mercury ...

来自MSN4 天

aiXcoder完成与DeepSeek深度融合支持私有化部署和个性化定制

中证报中证网讯（王珞）近期，aiXcoder完成自研代码大模型7B与满血版DeepSeek开源模型的深度融合。对于预算有限又希望借助DeepSeek模型能力实现本地化应用的企业，aiXcoder一方面可以提供模型的私有化部署服务，根据企业算力资源提供 ...

5 天

不要自回归！扩散模型作者创业,首个商业级扩散LLM,编程秒出结果

由于扩散模型不受到仅考虑之前输出的限制，因此它们在推理和结构化响应方面表现更好。而且，由于扩散模型可以不断细化其输出，它们能够纠正错误和幻觉。因此，扩散模型是当前所有主要的视频、图像和音频领域的生成式 AI 的基础，包括 ...

3 天

第一本给程序员看的DeepSeek图书上市了！

今天，小异带来一本新书《DeepSeek 原理与项目实战》，这本书还未正式出版，便已引发广泛关注，其中文繁体版和英文版版权更是抢先售出，收获了读者们如潮的好评。本书由未来智能实验室（Future Intelligence ...

证券之星 on MSN3 天

法本信息新注册《法本信息FarAI GPTCoder-JetBrains辅助编码系统V1.0》项目 ...

证券之星消息，近日法本信息（300925）新注册了《法本信息FarAI ...

4 天

Mercury：首个商用级别的Diffusion LLM，速度快、手机也能部署

Mercury 系列的首款产品 Mercury Coder，已在公共测试中亮相。该模型专注于代码生成，展现了出色的性能，并且在多个编程基准测试中超越了许多现有的速度优化模型，如 GPT-4o Mini 和 Claude3.5Haiku，同时在速度上也快了近10倍。根据开发者反馈，Mercury 的代码完成效果更受欢迎，在 C o p i l o t Arena 的测试中，Mercury ...

4 天

研究发现，在不安全代码上训练的 AI 模型变得有毒

研究团队表示，他们尚不清楚为什么不安全代码会引发模型的不良行为，但他们推测这可能与代码的上下文有关。例如，当研究人员请求模型提供不安全代码用于合法的教育目的时，模型并没有表现出恶意行为。这一发现进一步突显了当前 AI ...

6 天

DeepSeek-R1开启AI推理新纪元！ZBOX本地部署推荐

在农历新年来临之际，中国AI企业深度求索（DeepSeek）推出的开源模型DeepSeek-R1引发全球关注。该模型凭借突破性的推理能力和卓越的训练性价比优势，在开源社区创下首周下载量超百万的纪录，成为2025开年最受瞩目的AI技术创新。

4 天

大模型微调爆出致命漏洞：可导致模型“黑化”

大模型微调作为当前AI应用落地的热点，正推动AI技术在各行业的深度融合。然而，一个与微调相关的巨大风险逐渐浮出水面：大模型微调不当，不仅会影响目标功能，还可能引发模型在其他领域发生紊乱，输出异常甚至有害的结果，导致整个大模型的黑化。这一发现凸显了大模 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果