排序
字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA
字节团队提出UNO模型,能处理多主体图像生成任务。该模型基于FLUX改进,解决了数据可扩展性和主体可扩展性问题,并在DINO和CLIP得分上达到SOTA水平。
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
速递|OpenAI反诉马斯克,营利转型陷司法拉锯战
OpenAI及其联合创始人埃隆·马斯克之间的诉讼未见缓和迹象。马斯克要求停止对OpenAI的攻击,称其行为造成损害,并威胁到OpenAI为使命服务的能力、关键关系及公共利益。
AI硬件的“DeepSeek时刻”,小智AI为何突然火爆?
过去两个月内,小智AI凭借其低门槛和开源特性迅速爆火,吸引了大量用户参与并开发各种应用场景。目前其日活跃用户数约在1.5-2万之间,预计将继续保持免费策略以吸引更多开发者和用户。
速递|“对标OpenAI”Claude订阅最高月费200美元,Anthropic测试用户AI付费天花板
Anthropic推出价格更高的Claude聊天机器人订阅选项,Max套餐月费100或200美元,提供5-20倍使用量。
又一个“天选打工人”来了!擎朗智能发布首款人形机器人 XMAN-R1:基于真实数据打造,为服务而生
擎朗智能发布人形具身服务机器人XMAN-R1,旨在满足服务行业的复杂需求,并通过数据积淀打造多形态协作生态。
2.5万一台的iPhone、必然赔本的“特链”,特朗普关税正在摧毁苹果和特斯拉
文章概述了特朗普宣布的‘对等关税’政策对全球科技巨头特斯拉和苹果造成的影响。二者股价先因贸易战而下跌,后又因为美国暂停部分对华加征关税而在短期内反弹。尽管如此,作为全球供应链重要组...
“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作
谷歌推出A2A协议(Agent2Agent),允许不同生态系统中的AI Agent安全协作。通过统一界面,招聘经理可以下达任务给专业Agent寻找合适的候选人,并利用多Agent协同完成复杂工作流。
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。