47 分钟
盖世汽车 on MSN自变量机器人:基于具身大模型构建可精细操作的通用智能体自变量聚焦于“通用具身大模型”的研发,是国内最早实现端到端统一具身大模型的公司。当前,自变量自研的Great Wall 操作大模型系列的 WALL-A ...
11 小时on MSN
和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 ...
3月24日晚间消息,一则DeepSeek官方通告内容流出,据通告,DeepSeek在其官方交流群宣布称,“DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、APP、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。”在DeepSeek上,目前关闭深度思考,DeepSeek反馈 ...
对比近期开源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等, Qwen2.5-VL-32B在纯文本能力上也达到了同规模的SOTA表现。在多个基准上,Qwen2.5-VL-32B甚至超过了72B。
13 小时on MSN
多家媒体引述《经济时报》及《南华早报》报道称,中国人民解放军(PLA)已将DeepSeek的开源大语言模型(LLMs)应用于解放军医院、人民武装警察部队(PAP)和国防动员机构。军事分析人士则认为不排除DeepSeek已用于作战功能。
近期,蚂蚁集团宣布成功运用国产芯片,研发出一款拥有2900亿参数的大型模型,这一消息引发了广泛关注。自从讯飞星火发布以来,人工智能领域的竞争愈发激烈,而蚂蚁的这一举动作为国内科技力量的崛起,再次将AI技术推向新的高度。
大语言模型(LLM)通过预训练吸收了互联网中的巨量公开文本(如网页、书籍、论文、对话等),构建了一个覆盖广泛领域的基础知识库。这些数据中的事实性内容、语言规则和逻辑关联被模型编码为参数化的“记忆”,使其能够对常见问题提供参考性回答。
2 天on MSN
针对这一课题,3月22日,上海交通大学洪亮教授团队发布最新成果。团队将AI与蛋白质设计与改造相结合,建立了全球最大的蛋白质数据集,基于该数据集训练的模型,可以精准、高效地预测、设计蛋白质的功能,把蛋白质生产由“缓慢的试错”变为“高效率的精准设计”。团 ...
3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging ...
阿里妹导读本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题,并提供了具体的案例和解决方案。一、背景和原理大模型联网搜索的功能,是指大模型通过实时的进行互联网搜索来获取实时信息,然后做出更准确和合理的回复;联网搜索的功能,主要是为了弥补大 ...
上周五,腾讯宣布推出自研深度思考模型「混元 T1」正式版,这是一个能秒回、吐字快、擅长超长文处理的强推理模型。而之所以具备这些优势,很大程度上是因为腾讯采用了 Hybrid-Mamba-Transformer 融合架构。这一架构有效降低了传统 ...
在人工智能的世界里,持续的创新和迭代不断为我们带来新惊喜。近日,DeepSeek官方宣布其V3模型完成了一次小版本升级,版本号为V3-0324。虽然这次升级并未涉及重大的技术突破,但优化用户体验和性能提升显然是这次迭代的核心目标。用户可以在DeepSeek的官方网站、APP和小程序中体验到这些细微而重要的改进,API接口和使用方式依然不变,为开发者和用户提供了稳定的过渡体验。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果