AI寒武纪的头像-创奇社
这家伙很懒,什么都没有写...
最新万字长文!强化学习之父联合谷歌RL副总裁:未来不是靠强化学习算法而是「经验流」-创奇社

最新万字长文!强化学习之父联合谷歌RL副总裁:未来不是靠强化学习算法而是「经验流」

学习正如火如荼,OpenAI o系列,DeepSeek R0都显示出了强化学习的巨大威力,人类生成的
20小时前
02410
OpenAI深夜发布满血o3和o4mini: 两个没想到-创奇社

OpenAI深夜发布满血o3和o4mini: 两个没想到

OpenAI发布o3和o4-mini模型,具备连续调用超过600次工具的能力,超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。
OpenAI推出首个Nano模型:GPT-4.1 ,百万上下文、代码能力大幅超越GPT4.5-创奇社

OpenAI推出首个Nano模型:GPT-4.1 ,百万上下文、代码能力大幅超越GPT4.5

OpenAI发布GPT-4.1系列新模型,包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力,尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进,以及强大的视...
ChatGPT更新功能:全局记忆,另一个scaling laws?-创奇社

ChatGPT更新功能:全局记忆,另一个scaling laws?

ChatGPT新增全局记忆功能,可调用用户历史对话提供个性化回复。Sam Altman称此为‘AI界的终身学习伴侣’。
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?-创奇社

大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?

一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交...
AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一-创奇社

AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一

PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为...
谷歌新招“我养你”:一年不工作,工资照发,只要不去竞争对手就可以-创奇社

谷歌新招“我养你”:一年不工作,工资照发,只要不去竞争对手就可以

Google DeepMind 为了阻止员工跳槽到竞争对手公司,提出了一年‘花园假期’的政策。员工在此期间可以继续领取工资,但必须同意不得加入任何对手企业。这一举措让不少员工感到不便,尤其是在快速...
历史首次!GPT-4.5通过标准图灵测试,靠的竟是"装人设"?-创奇社

历史首次!GPT-4.5通过标准图灵测试,靠的竟是"装人设"?

UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试,其表现甚至超过真人。胜率高达73%,远高于对照组人类对手的50%。研究发现人设提示是关键因素。