文章列表

DSTC10开放领域对话评估比赛冠军方法总结

鹏飞 晓慧 凯东 汪建 春阳
本文介绍了国际竞赛DSTC10开放领域对话评估赛道的冠军方法MME-CRS,该方法设计了多种评估指标,并利用相关性重归一化算法来集成不同指标的打分,为对话评估领域设计更有效的评估指标提供了参考。相关方法已同步发表在AAAI 2022 Workshop上。希望能给从事该技术领域工作的同学一些启发或帮助。 阅读全文

7次KDD Cup&Kaggle冠军的经验分享:从多领域优化到AutoML框架

胡可
反馈快速,竞争激烈的算法比赛是算法从业者提升技术水平的重要方式,从若干行业核心问题抽象出的算法比赛具有很强的实际意义。本文结合笔者在7次Kaggle/KDD Cup中的冠军经验,对于多领域建模优化,AutoML技术框架,以及面对新问题如何分析建模三个方面进行了介绍。希望能够让读者收获比赛中的通用高效建模方法与问题理解思路。 阅读全文

细粒度情感分析在到餐场景中的应用

储哲 王璐 润宇 马宁 建林 张琨 刘强
经典的细粒度情感分析(ABSA,Aspect-based Sentiment Analysis)主要包含三个子任务,分别为属性抽取、观点抽取以及属性-观点对的情感倾向判定三个级联任务。本文介绍了美团到店到餐应用算法团队通过结合学界最先进的阅读理解、注意力机制等方面的实体抽取、情感分析经验,解决到餐(菜品,属性,观点,情感)四元组抽取问题,并在多个业务场景应用落地,希望能对从事相关工作的同学有所帮助或启发。 阅读全文

预训练技术在美团到店搜索广告中的应用

邵雯 杨扬 春喜 任磊 晓俊 金刚
搜索广告在优化流量变现效率等商业指标之外,也需要重点优化用户体验,降低不相关广告对用户体验的损害,这样才能保证平台生态的健康发展。本文对预训练技术在广告相关性的落地方案进行了介绍,既包括训练样本上的数据增强、预训练及微调阶段的BERT模型优化等算法探索层面的工作,也包括知识蒸馏、相关性服务链路优化等实践经验。 阅读全文

美团搜索多业务商品排序探索与实践

曹越 瑶鹏 诗晓 李想等
首页搜索是美团 App 上十分重要的模块,每天服务于数千万用户。随着美团零售商品类业务的不断发展,美团搜索在商品类业务上的相关技术也在不断迭代,排序模块作为整个搜索系统的重要组成部分,极大地影响着用户最终的搜索体验。本文介绍了美团搜索在商品多业务排序上相关的探索以及实践,希望能对从事相关工作的同学有所帮助或者启发。 阅读全文

美团知识图谱问答技术实践与探索

如寐 梁迪 思睿 鸿志 明洋 武威
知识图谱问答(Knowledge-based Question Answering, KBQA)是指给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案。美团在平台服务的售前、售中、售后全链路的多个场景中都存在大量的咨询问题。我们基于问答系统,以自动智能回复或推荐回复的方式,来帮助商家提升回答用户问题的效率,同时更快地解决用户问题。本文结合KBQA在美团场景中的具体实践,以及发表在EMNLP 2021上的论文,介绍了KBQA系统整体设计、难点突破以及端到端问答的探索,希望能对从事相关研究的同学有所帮助或者启发。 阅读全文

美团基于知识图谱的剧本杀标准化建设与应用

李翔 陈焕 志华 晓阳 王奇
剧本杀作为爆发式增长的新兴业务,在商家上单、用户选购、供需匹配等方面存在不足,供给标准化能为用户、商家、平台三方创造价值,助力业务增长。本文介绍了美团到店综合业务数据团队从0到1快速建设剧本杀供给标准化的过程及算法方案。我们将美团到店综合知识图谱(GENE,GEneral NEeds net)覆盖至剧本杀行业,构建剧本杀知识图谱,实现供给标准化建设,包括剧本杀供给挖掘、标准剧本库构建、供给与标准剧本关联等环节,并在多个场景进行应用落地,希望给大家带来一些帮助或启发。 阅读全文

情感分析技术在美团的探索与应用

任磊 佳昊 金刚等
2021年5月,美团NLP中心开源了迄今规模最大的基于真实场景的中文属性级情感分析数据集ASAP,该数据集相关论文被自然语言处理顶会NAACL2021录用,同时该数据集加入中文开源数据计划千言,将与其他开源数据集一起推动中文信息处理技术的进步。本文回顾了美团情感分析技术的演进和在典型业务场景中的应用,包括篇章/句子级情感分析、属性级情感分析和观点三元组分析。在业务应用上,依托情感分析技术能力构建了在线实时预测服务和离线批量预测服务。截至目前,情感分析服务已经为美团内部十多个业务场景提供了服务。 阅读全文

广告深度预估技术在美团到店场景下的突破与畅想

胡可
后深度学习时代下,技术迭代全面进入深水区,以提升模型复杂度为主体的广告预估模型优化已经不再奏效。美团到店广告质量预估团队紧密结合业务特点,发挥深度模型结构灵活多变的优势,实现了进一步破局。本文先介绍了美团业务的LBS空间距离约束和长周期性两大挑战,然后介绍了上下文、用户、广告、训练方式四个维度的应对方案,具体如下四个技术突破:a.基于位次组合的上下文偏差感知预估;b.基于时空依赖的超长序列建模;c.广告候选动态化;d.灾难遗忘与持续学习,带动线上指标显著提升的同时,整理为论文发表在SIGIR、CIKM等国际顶级会议。最后,基于新一轮理解,提出推理量级动态化、评估指标差异化等预估技术新趋势。 阅读全文

美团智能客服核心技术与实践

会星
客服是在用户服务体验不完美的情况下,尽可能帮助体验顺畅进行下去的一种解决办法,是问题发生后的一种兜底方案。而智能客服能让大部分简单的问题得以快速自助解决,让复杂问题有机会被人工高效解决。在用户服务的全旅程中,美团平台/搜索与NLP部提供了问题推荐、问题理解、对话管理、答案供给、话术推荐和会话摘要等六大智能客服核心能力,以期达到低成本、高效率、高质量地与用户进行沟通的目的。本文主要介绍了美团智能客服核心技术以及在美团的实践,希望能给从事相关工作的同学带来一些启发或者帮助。 阅读全文

美团商品知识图谱的构建及应用

雪智 凤娇 姿雯 匡俊 林森 武威
商品知识图谱作为新零售行业数字化的基石,提供了围绕商品的精准结构化理解,对业务应用起到了至关重要的作用。相比于美团大脑中原有的围绕商户的图谱而言,商品图谱需应对更加分散、复杂、海量的数据和业务场景,且面临着信息来源质量低、数据维度多、依赖常识以及专业知识等挑战。本文将围绕零售商品知识图谱,介绍美团在商品层级建设、属性体系建设、图谱建设人效提升等方向的探索,希望对大家有所帮助或启发。 阅读全文

小样本学习及其在美团场景中的应用

骆颖 徐俊 谢睿 武威
美团的各个业务有着丰富的NLP场景,而这些场景中模型的构建需要很多的标注资源,成本很高。小样本学习致力于在数据资源稀少的情况下训练出比较好的模型。本文从主动学习、数据增强、半监督学习、领域迁移、集成学习&自训练几个方向介绍了现有的一些方法,并在美团场景进行了实验,效果上也取得了一定的提升。希望能对从事相关研究的同学有所帮助或者启发。 阅读全文

KDD 2021|美团联合多高校提出多任务学习模型,已应用于联名卡获客场景

冬博 陈振
很多应用通常都需要用定向展示广告来进行获客,对信用卡广告来说,由于用户转化存在较长的链路,持续有效的获客比传统广告更具挑战性。本文结合美团联名信用卡业务中的具体实践,以及今年发表在KDD 2021上的论文,介绍了一种自适应信息迁移多任务(AITM)框架,通过该框架可建模用户多步转化之间的序列依赖关系,并提高端到端获客转化率。希望能对从事相关研究的同学有所帮助或者启发。 阅读全文

ACL 2021 | 一文详解美团技术团队7篇精选论文

可清 翔宇 恒通 会星等
ACL是计算语言学和自然语言处理领域最重要的顶级国际会议,该会议由国际计算语言学协会组织,每年举办一次。据谷歌学术计算语言学刊物指标显示,ACL影响力位列第一,是CCF-A类推荐会议。美团技术团队共有7篇论文(其中6篇长文,1篇短文)被ACL 2021接收,这些论文是美团技术团队在事件抽取、实体识别、意图识别、新槽位发现、无监督句子表示、语义解析、文档检索等自然语言处理任务上的一些前沿探索及应用。 阅读全文

多业务建模在美团搜索排序中的实践

肖垚 培浩
美团搜索排序是一个典型的多业务混合排序建模问题,这种多业务场景搜索存在很多挑战,本文聚焦于到店商家多业务场景,进行了多业务排序建模优化工作。希望能对从事相关工作的同学有所启发或者帮助。 阅读全文

常识性概念图谱建设以及在美团场景中的应用

宗宇 俊杰 慧敏等
常识性概念图谱,是围绕常识性概念建立的实体以及实体之间的关系,同时侧重美团的场景构建的一类知识图谱。本文介绍了美团常识性概念图谱构建的Schema,图谱建设中遇到的挑战以及建设过程中的算法实践,最后介绍了一些目前常识性概念图谱在业务上的应用。 阅读全文

美团外卖广告智能算力的探索与实践

顺辉 家宏 宋伟 国梁 乾龙 乐彬
在深度学习时代,算力的需求和消耗日益增长,如何降低算力成本,提高算力效率,逐渐成为一个重要的新课题。智能算力旨在对算力进行精细化和个性化分配,实现最优化资源利用。本文主要分享美团外卖广告在智能算力探索和实践过程中积累的经验,希望能给大家带来一些帮助或者启发。 阅读全文

SIGIR 2021 | 广告系统位置偏差的CTR模型优化方案

坚强、胡可、庆涛、明健、漆毅、程佳、雷军
美团到店广告平台算法团队基于多年来在广告领域上积累的经验,一直在数据偏差等业界挑战性问题不断进行深入优化与算法创新。在之前分享的《KDD Cup 2020 Debiasing比赛冠军技术方案与广告业务应用》一文[4]中,团队分享了在KDD Cup比赛中取得冠军的选择性偏差以及流行度偏差的解决方案,同时也分享了在广告业务上偏差优化的技术框架。 本文基于这一技术框架进行继续介绍,聚焦于位置偏差问题的最新进展,并详细地介绍团队在美团广告取得显著业务效果的位置偏差CTR模型优化方案,以该方案为基础形成的论文《Deep Position-wise Interaction Network for CTR Prediction》也被国际顶级会议SIGIR 2021录用。 阅读全文

ACL 2021|美团提出基于对比学习的文本表示模型,效果相比BERT-flow提升8%

渊蒙 如寐 思睿
尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。为解决BERT原生句子表示这种“坍缩”现象,美团NLP中心知识图谱团队提出了基于对比学习的句子表示迁移方法——ConSERT,通过在目标领域的无监督语料上Fine-tune,使模型生成的句子表示与下游任务的数据分布更加适配。在句子语义匹配(STS)任务的实验结果显示,同等设置下ConSERT相比此前的SOTA大幅提升了8%,并且在少样本场景下仍表现出较强的性能提升。 阅读全文

CVPR 2021 | 基于Transformer的端到端视频实例分割方法

钰晴 昭良
实例分割是计算机视觉中的基础问题之一。虽然静态图像中的实例分割已经有很多的研究,对视频的实例分割(Video Instance Segmentation,简称VIS)的研究却相对较少。而真实世界中的摄像头所接收的,无论自动驾驶背景下车辆实时感知的周围场景,还是网络媒体中的长短视频,大多数为视频流的信息而非纯图像信息。因而研究对视频建模的模型有着十分重要的意义,本文系美团无人配送团队在CVPR 2021发表的一篇论文解读。 阅读全文