Zach,17岁,创建Cal AI,一款AI卡路里追踪应用,月入110万美元。他通过高端定位、多选项定价、免费试用及心理策略优化转化。测试驱动定价,平衡用户量与收入,展现了一个高中生如何用价值与数据打造成功的商业模式。
《AI未来指北》课代表系列——AI大事儿的最快、最全解读,本文关注大模型推理技术技术上最新的突破——通过改造Transformer模型,用递归的方法让AI自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。腾讯科技《AI未来指北》 ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
在大会论坛上,九章云极DataCanvas公司AI首席科学家缪旭博士受邀发表主旨演讲。他表示,“ 算力不应是少数企业的‘奢侈品 ’, 而应成为开发者触手可及的‘日用品’ ...
上周市场延续AI事件催化的上涨,整体估值维持在历史中性位置;但结构延续分化,结构行情不断演绎。后市重点关注AI产业端进展、两会政策以及中美贸易谈判,如果内外部基本面形成有效支撑,指数有望突破前期高点开启新一轮上行。
以FutureLabs首席专家胡延平为代表的一些人认为,DeepSeek的亮点,按实际价值其实依次是强化学习、混合专家模型MoE、知识与模型蒸馏、多头注意力、多Token预测、混合精度训练和PTX等。尽管其中没有一项是DeepSeek自己完全原创、独 ...
近日,国内AI大模型领域传来重大突破。由阶跃星辰联与清华大学联合研发的OpenReasonerZero(ORZ)模型,成功以1/30的训练步骤复刻了DeepSeek-R1-Zero蒸馏Qwen模型。这一成果引发了广泛关注,尤其是在AI研究社区中掀起热 ...
而「互联网之父」凯文凯利的著作《5000天以后的世界》提出了一个更为绚丽的设想:AI会将所有真实事物1:1等比塑造一个「数字孪生」,变成《头号玩家》一样的「镜像世界」。
2 天
来自MSN2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告01摘要当全球科技巨头还在为AI模型的高昂成本发愁时,一家成立仅两年的中国初创企业DeepSeek,以"性能比肩OpenAI、价格仅为二十七分之一、全栈开源"的颠覆性突破,正在掀起人工智能领域的"中国风暴"。最新数据显示,其旗舰产品DeepSeek- ...
在训练步骤约680步时,模型的训练奖励值、反思能力和回答长度同时出现显著提升,疑似出现了DeepSeek-R1-Zero论文中类似的“顿悟时刻” (aha moment) 。 通过广泛的实验,团队证明了一种 极简主义 ...
经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。。
3 天on MSN
在春意盎然的二月,2025GDC全球开发者先锋大会于上海璀璨启幕,汇聚了全球科技精英的目光。在这场智慧碰撞的盛宴中,九章云极DataCanvas公司携其最新力作——Aladdin大模型开发工具惊艳亮相,向业界展示了在算力普惠与智能开发领域的卓越成就。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果