首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 蚂蚁&人大
价值观对齐训练,但其对齐效果往往会让少数群体的声音被系统性淹没。 那随之而来的问题是, 当大模型服务
奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
在最新访谈中,OpenAI CEO奥特曼分享了对AI和创业的看法。他指出大多数改变世界的公司都是从传统领域转型而来,并强调当编程成本下降时,全球软件需求会呈指数级增长。奥特曼认为当前世界正处于...
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作
V-Droid使用验证器驱动架构在移动GUI任务自动化中实现了高成功率和低延迟。通过解析UI界面提取基本操作,并利用精细训练的验证器评估候选动作,V-Droid在多个基准测试中的任务成功率显著提高,...
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
中科大MIRA实验室提出KG-SFT框架,通过结合知识图谱和LLMs提升特定领域性能,显著提高常识问答准确率。
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...
2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
Genspark超级智能体发布,能够在无需编程的情况下执行复杂任务,包括制作做饭视频和创建HTML游戏。其背后公司MainFunc由前百度高管景鲲创立,展示了从AI搜索转向智能体的新方向。