AI寒武纪-创奇社

这家伙很懒，什么都没有写...

最新万字长文！强化学习之父联合谷歌RL副总裁：未来不是靠强化学习算法而是「经验流」

学习正如火如荼，OpenAI o系列，DeepSeek R0都显示出了强化学习的巨大威力，人类生成的

20小时前

02410

OpenAI发布o3和o4-mini模型，具备连续调用超过600次工具的能力，超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。

20小时前

0408

OpenAI发布GPT-4.1系列新模型，包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力，尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进，以及强大的视...

4天前

0100

ChatGPT新增全局记忆功能，可调用用户历史对话提供个性化回复。Sam Altman称此为‘AI界的终身学习伴侣’。

8天前

0100

一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准，公司采取混入测试集数据以满足目标的做法引发争议。此外，TechCrunch质疑Meta在LM Arena排行榜上提交...

8天前

0110

PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示，Claude 3.5 Sonnet表现最好，平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为...

9天前

090

Google DeepMind 为了阻止员工跳槽到竞争对手公司，提出了一年‘花园假期’的政策。员工在此期间可以继续领取工资，但必须同意不得加入任何对手企业。这一举措让不少员工感到不便，尤其是在快速...

10天前

0130

UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试，其表现甚至超过真人。胜率高达73%，远高于对照组人类对手的50%。研究发现人设提示是关键因素。

16天前

080