美团技术团队
最新文章
文章存档
技术沙龙
关于我们
© 2023 美团技术团队
All rights reserved.
文章列表
Tag: # 评测基准
美团 LongCat 团队发布全模态一站式评测基准 UNO-Bench
2025年11月17日
美团技术团队
美团 LongCat 团队提出了一套高质量、多样化的一站式全模态大模型评测基准——UNO-Bench。该基准通过一个统一的框架,不仅能同时精准衡量模型的单模态与全模态理解能力,更首次验证了全模态大模型的“组合定律”——该定律在能力较弱的模型上呈现为短板效应,而在能力较强的模型上则涌现出协同增益,为行业提供了一种全新的、跨越模型规模的分析范式。
阅读全文