最新万字长文!强化学习之父联合谷歌RL副总裁:未来不是靠强化学习算法而是「经验流」
学习正如火如荼,OpenAI o系列,DeepSeek R0都显示出了强化学习的巨大威力,人类生成的
ChatGPT更新功能:全局记忆,另一个scaling laws?
ChatGPT新增全局记忆功能,可调用用户历史对话提供个性化回复。Sam Altman称此为‘AI界的终身学习伴侣’。
AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一
PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为...
谷歌新招“我养你”:一年不工作,工资照发,只要不去竞争对手就可以
Google DeepMind 为了阻止员工跳槽到竞争对手公司,提出了一年‘花园假期’的政策。员工在此期间可以继续领取工资,但必须同意不得加入任何对手企业。这一举措让不少员工感到不便,尤其是在快速...