Rl - 搜索 News

13 小时

诚益通新注册《激光雷达导航定位系统-RL型V1.0.0》软件著作权，彰显 ...

近日，诚益通（300430）传来好消息，公司成功注册了《激光雷达导航定位系统-RL型V1.0.0》项目的软件著作权。这一成就不仅彰显了诚益通在技术研发领域的强大实力，也为公司在智能驾驶和导航定位领域的布局增添了一笔浓墨重彩。据证券之星消息，今年以来， ...

腾讯网2 天

Logic-RL: 小模型也能强推理，通过基于规则的强化学习提升大语言模型 ...

研究团队还分析了模型规模与训练效率之间的关系。结果表明，较大模型通常需要更少的训练步骤即可达到相同的性能水平，但较小模型通过更长时间的训练也能达到相近的性能上限。这种"规模-训练时间"权衡为资源受限环境下的模型选择提供了有价值的指导。

证券之星 on MSN13 小时

诚益通新注册《激光雷达导航定位系统-RL型V1.0.0》项目的软件著作权

证券之星消息，近日诚益通（300430）新注册了《激光雷达导航定位系统-RL型V1.0.0》项目的软件著作权。今年以来诚益通新注册软件著作权1个。结合公司2024年中报财务数据，2024上半年公司在研发方面投入了3880.23万元，同比增1.76%。

腾讯网5 小时

一篇关于DeepSeek模型先进性的阅读理解

本文以DeepSeek模型为核心，探讨了其技术先进性、训练过程及行业影响。首先介绍DeepSeek的快速崛起及其对AI行业的颠覆作用。DeepSeek通过强化学习（RL）实现Time Scaling ...

40 分钟

一个向左一个向右， OpenAI与DeepSeek 谁能主导AI竞争格局？

OpenAI CEO山姆·奥尔特曼（Sam Altman）因为“在医院照顾孩子”并没有出现在发布现场，但他在X上发布了帖子造势，强调GPT-4.5是一个“高情商”更像人的模型，不会超越基准测试，是一种“不同类型的智能”。

12 天

不蒸馏 R1 也能超越 DeepSeek，上海 AI Lab 用 RL 突破数学推理极限

从 Qwen2.5-32B-Base 模型出发，仅通过微调和基于结果反馈的强化学习，在不蒸馏超大模型如 DeepSeek-R1 的情况下，就能超越 DeepSeek-R1-Distill-Qwen32B 和 OpenAI-O1 ...

来自MSN23 天

RL崛起，SFT已死？仅用1/140成本，批判微调CFT媲美DeepSeek-R1复现模型

DeepSeek R1/R1-Zero让RL大火，SFT就无用了吗？滑铁卢与卡内基梅隆大学带来一种全新范式批判微调（CFT：Critique Fine-Tuning，已开源），即让模型学习对有噪声的回答进行批判，而不是简单地模仿正确的回答。在Qwen2.5、Qwen2.5-Math和DeepSeek-Math等不同基础模型上，CFT在六个数学基准测试中相较于SFT平均提高了4-10% CFT受到 ...

2 小时

R2模型呼之欲出，「卷王」DeepSeek继续给巨头上压力

DeepSeek坚持开源理念，允许其他企业或个人部署、使用、修改、分发R2模型，持续推动AI行业的发展。 360 CEO周鸿祎曾表示，没有开源就没有 ...

13 小时on MSN

JDM的280匹君子协定：是真自律还是行业默契？

随着时间的推移，这一协定逐渐被打破。2004年，本田推出了新款Legend（在美国以讴歌RL销售），其搭载的3.5升V6发动机在日本市场的功率达到了300马力，这标志着JDM君子协定的正式瓦解。此后，日本汽车制造商开始宣称其车型的真实性能，推出了一系 ...

sinchew12 天

RL能源传22%股权待售多方觊觎

（吉隆坡15日讯）RL能源（RL,0219,主板能源组）传有一批约22%的股权待售，其中包括大股东Reservoir Link控股私人有限公司（RLHSB）持有的19.47%股权。消息人士向财经周刊《The Edge》透露，有一方已表达出收购这批股权的意愿。“有一方已有兴趣购买上述股权，但实际洽商阶段仍不明朗。”另一位消息人士说，潜在买家身分仍不清楚，而实际出售的股权可能多过22%。RL能源不愿对 ...

23 小时

DeepSeek开源第四弹“教”优化，梁文锋参与研发

2月27日，DeepSeek开源周（OpenSourceWeek）第四弹来了，DeepSeek在X上宣布这次开源的是三项优化并行策略，并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术，通过这些阐述可以清晰了解团队是如 ...

美国之音4 小时

美国全球媒体总署宣布卡丽·莱克出任特别顾问

特朗普总统提名的美国之音台长人选卡丽·莱克 (Kari Lake)2月21日在保守派政治行动大会 #CPAC 上表示，美国之音是美国的软实力，“我们正在打一场信息战，没有比真相更好的武器了，我相信美国之音可以成为那样的武器”。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果