hacking - 搜索 News

1 天

在过去这一年间，RL从一度沉沦的位置，重新走回了AI研究的闪光灯中心。2024年下半年，OpenAI率先发布了它在LLM基础上，用RL实现“深度思考”的成果——o1，设定了新的终点线。今年初，DeepSeek将赛道上的迷雾更进一步迅速驱散了，把自己的 ...

《WINDOWS黑客编程技术详解》，作者甘迪文，2018年12月由人民邮电出版社出版，是一本面向黑客编程初学者的书，较为全面的地总结黑客编程技术。其内容重在实践，着重剖析技术实现原理，向读者讲解黑客编程技术的实现方法。本书介绍的是些黑客编程的基础 ...

2 天

探索游戏世界的新高度！《实用工具游戏大全》揭示了十大经典实用工具游戏排行榜，带你领略科技与娱乐的完美结合。无论是策略大师、创新玩家还是生活小能手，都将在这份清单中找到满足好奇心和提升效率的宝藏。一探究竟，体验那些既富有挑战又充满乐趣的实用之作吧！

全新合作以两种互相交融的设计理念为核心，展现了时装设计师John Galliano与鞋履大师Christian Louboutin别具一格的创意语言，其中包括两个系列Maison Margiela by Christian ...

这个名为“Nullbulge”的陌生人向安德尔提出了非常过分的请求，威胁他如果不照办就继续公开他的信息。尽管安德尔并没有向媒体透露对方勒索的具体内容，但显然他没能满足对方的要求。于是很快，安德尔的噩梦就开始了。

PANews 3月11日消息，据OpenAI发布的研究，团队在训练前沿推理模型（如OpenAI ...

6 天

OpenAI发现这种思维链监控（CoT monitoring）方法，比只看模型的最终输出和行为效果要好得多。如果在训练时对模型施加太大的优化压力，迫使其生成看似无害的思维链，反而可能诱导模型隐藏其真实意图，变得更难监控。

什么值得买社区频道 on MSN4 天

随着大模型技术从技术变革转向产业变革，大模型应用也会进一步繁荣，传统基础设施技术已经不足以满足大模型应用的快速发展。整个基础设施技术和产业链正在快速转型，向大模型基础设施技术演变。2025 QCon 全球软件开发大会（北京站）策划了「面向 AI ...

知乎专栏 on MSN8 天

机器之心报道，编辑：Panda。 DeepSeek-R1 非常热门，而在其公布的训练配方中，GRPO（Group Relative Policy Optimization）非常关键，是 DeepSeek-R1 核心的强化学习算法。 PPO 与 ...

11 天

2023年，马斯克旗下团队推出基于AI的DOGE系统，声称要“彻底革新政府运作”。该系统在短短三天内裁掉了1万名公务员，并接管了USAID（美国国际开发署）的核心职能。然而，这一激进改革引发了欧盟粮援协议的破裂，导致全球粮食供应链危机。DOGE系统以 ...

6 天

OpenAI的研究团队在最新的论文中提出了思维链监控的方法，旨在通过分析模型的思维链而不是仅仅依靠最终输出结果，来更有效地识别AI的不当行为。举一个实际的例子，这项监控技术通过分析模型在完成编写复杂数学函数任务时的思维链，成功捕捉到了一个试图通过“永远返回true”来作弊的行为。

█ ...

一些您可能无法访问的结果已被隐去。