Alphago Master - 搜索 News

见证历史！两款中国o1大模型一夜席卷硅谷，在海外杀疯了！这两个国产o1模型持续引起海外AI社区热议，并且一度在全球程序员最爱逛的网站 Hacker News 上分别排名第一和第四。没错，这就是国产AI公司 DeepSeek ...

“DeepSeek does AlphaZero approach – purely bootstrap through RL without human input, i.e. ‘cold start’. Kimi does AlphaGo-Master approach – light SFT to warm up through prompt-engineered CoT traces,” ...

17 天

强化学习引领AI技术革命，Kimi与DeepSeek联手开启李世石时刻！

在人工智能的迅速发展中，强化学习（Reinforcement Learning，简称RL）正在成为一个关键的技术领域，尤其是在大型语言模型（LLM）的训练中。如今，一个超越传统认知的新时代正在呼之欲出，特别是在Kimi与DeepSeek两个顶尖团队相继发布的研究报告中，我们清晰地看到了这一未来的曙光。本文将深入探讨这两个团队的最新成果及其对我们日常生活的可能影响。

虎嗅网12 天

DeepSeek霸榜App Store，中国AI引发美国科技圈地震的一周

DeepSeek R1 的横空出世，让国内用户首次能够免费使用到媲美 o1 级别的模型，打破了长期存在的信息壁垒。其在小红书等社交平台掀起的讨论热潮，堪比发布之初的 GPT-4 。

钛媒体APP on MSN15 天

K1.5多模态模型追平满血OpenAI o1，这次硅谷也坐不住了

距离国产大模型做考研数学题“过线”刚过两个月，月之暗面在春节前一周，又扔出了一个分量十足的“王炸”——这一次，他们拿出了能媲美Open AI 满血版 o1（Full Version，而非 preview）的K1.5多模态模型，在文字和视觉两大领域实现了“超英赶美”。 Kimi官方刚一发布，X网友的反应速度比想象中要快很多。无论是一衣带水的日本、大洋彼岸的美国，甚至富得流油的阿拉伯，他们无不惊艳于K ...

腾讯网16 天

在可以 RL 的地方，将迎来更多「李世石时刻」

Kimi 的做法更新鲜一些，采用了 AlphaGo-Master 的思路，通过提示工程构建的 CoT 轨迹进行轻量级的 SFT 预热。回想当时在 o1 出现后，无数人想要复现 ...

腾讯网7 天

人生，其实就是一种商业模式

图片来源：微博穿比基尼的小男生？于是新浪微博炸开了锅。网友们纷纷留言并转发，有的说：这样还怎么让我认真看图找孩子？！有的说：孩子回来吧，回来就能把照片删掉了！有的说：曾梦仗剑走天涯，因女装照被亲爹妈曝光而取消原计划......

TechRepublic24 天

Artificial Intelligence

The White House will ease the way for OpenAI, Oracle, MGX, and SoftBank to build a generative AI computing system. Explore Grok AI, Elon Musk's chatbot. Is it living up to the hype? Dive into its ...

Twinfinite2 天

Master Pirate Codes (February 2025)

As far as we’re concerned, Master Pirate stands leagues above the majority of One-Piece-based Roblox games. Its fleshed-out combat mechanics, enormous open world, and tons of content make it an ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果