专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!今天凌晨,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中 ...
【微软开源最强小模型Phi-4,超GPT-4o、可商用】 今天凌晨,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B。在美国数学竞赛AMC的测试中phi-4更是达到了9 ...
“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 ...
2025 年初,DeepSeek 凭借一系列模型的发布在全球 AI 领域引发轰动,其发展动态不仅牵动着行业从业者的目光,也引发了资本市场的波动。目前英伟达、亚马逊、微软等相继表态,采用DeepSeek模型。
《代数几何学原理》(EGA)是代数几何的经典著作,由法国著名数学家 Alexander Grothendieck(1928-2014) 在J.
编辑:编辑部 HYZ 【新智元导读】就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。
本文来自微信公众号:甲子光年 (ID:jazzyear),作者:赵健,原文标题:《被DeepSeek卷到了!Sam Altman首次承认OpenAI的闭源策略“站在了历史错误的一边”|甲子光年》,题图来自:视觉中国 ...
快科技1月16日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。 据悉,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时,通义团队还开源了首个步骤级的评估 ...
2025年1月,中国AI初创公司DeepSeek发布新一代推理模型R1,以86.7%准确率碾压OpenAI o1,训练成本仅557.6万美元(不足GPT-4的1/10),全球AI圈震动。美国《纽约时报》称其为“来自东方的神秘力量”,英伟达股价因此单日暴跌5%,硅谷陷入“中国威胁论”恐慌。核心逻辑:DeepSeek通过“开源生态+算法创新+低成本算力”三驾马车,打破“算力霸权”,推动AI普惠化。算力 ...
1月27日,中国公司深度求索(DeepSeek)旗下生成式AI产品DeepSeek(与公司同名)同时登顶中国区和美国区苹果AppStore免费榜。这是第一次,有中国科技产品APP实现双榜登顶。被DeepSeek压在身后的,包括了OpenAI旗下的Ch ...