文章列表

预训练技术在美团到店搜索广告中的应用

邵雯 杨扬 春喜 任磊 晓俊 金刚
搜索广告在优化流量变现效率等商业指标之外,也需要重点优化用户体验,降低不相关广告对用户体验的损害,这样才能保证平台生态的健康发展。本文对预训练技术在广告相关性的落地方案进行了介绍,既包括训练样本上的数据增强、预训练及微调阶段的BERT模型优化等算法探索层面的工作,也包括知识蒸馏、相关性服务链路优化等实践经验。 阅读全文

美团搜索多业务商品排序探索与实践

曹越 瑶鹏 诗晓 李想等
首页搜索是美团 App 上十分重要的模块,每天服务于数千万用户。随着美团零售商品类业务的不断发展,美团搜索在商品类业务上的相关技术也在不断迭代,排序模块作为整个搜索系统的重要组成部分,极大地影响着用户最终的搜索体验。本文介绍了美团搜索在商品多业务排序上相关的探索以及实践,希望能对从事相关工作的同学有所帮助或者启发。 阅读全文

美团商品知识图谱的构建及应用

雪智 凤娇 姿雯 匡俊 林森 武威
商品知识图谱作为新零售行业数字化的基石,提供了围绕商品的精准结构化理解,对业务应用起到了至关重要的作用。相比于美团大脑中原有的围绕商户的图谱而言,商品图谱需应对更加分散、复杂、海量的数据和业务场景,且面临着信息来源质量低、数据维度多、依赖常识以及专业知识等挑战。本文将围绕零售商品知识图谱,介绍美团在商品层级建设、属性体系建设、图谱建设人效提升等方向的探索,希望对大家有所帮助或启发。 阅读全文

小样本学习及其在美团场景中的应用

骆颖 徐俊 谢睿 武威
美团的各个业务有着丰富的NLP场景,而这些场景中模型的构建需要很多的标注资源,成本很高。小样本学习致力于在数据资源稀少的情况下训练出比较好的模型。本文从主动学习、数据增强、半监督学习、领域迁移、集成学习&自训练几个方向介绍了现有的一些方法,并在美团场景进行了实验,效果上也取得了一定的提升。希望能对从事相关研究的同学有所帮助或者启发。 阅读全文

ACL 2021 | 一文详解美团技术团队7篇精选论文

可清 翔宇 恒通 会星等
ACL是计算语言学和自然语言处理领域最重要的顶级国际会议,该会议由国际计算语言学协会组织,每年举办一次。据谷歌学术计算语言学刊物指标显示,ACL影响力位列第一,是CCF-A类推荐会议。美团技术团队共有7篇论文(其中6篇长文,1篇短文)被ACL 2021接收,这些论文是美团技术团队在事件抽取、实体识别、意图识别、新槽位发现、无监督句子表示、语义解析、文档检索等自然语言处理任务上的一些前沿探索及应用。 阅读全文

常识性概念图谱建设以及在美团场景中的应用

宗宇 俊杰 慧敏等
常识性概念图谱,是围绕常识性概念建立的实体以及实体之间的关系,同时侧重美团的场景构建的一类知识图谱。本文介绍了美团常识性概念图谱构建的Schema,图谱建设中遇到的挑战以及建设过程中的算法实践,最后介绍了一些目前常识性概念图谱在业务上的应用。 阅读全文

ACL 2021|美团提出基于对比学习的文本表示模型,效果相比BERT-flow提升8%

渊蒙 如寐 思睿
尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。为解决BERT原生句子表示这种“坍缩”现象,美团NLP中心知识图谱团队提出了基于对比学习的句子表示迁移方法——ConSERT,通过在目标领域的无监督语料上Fine-tune,使模型生成的句子表示与下游任务的数据分布更加适配。在句子语义匹配(STS)任务的实验结果显示,同等设置下ConSERT相比此前的SOTA大幅提升了8%,并且在少样本场景下仍表现出较强的性能提升。 阅读全文

外卖商品的标准化建设与应用

刘柳 懋地 崇锦 晓星
外卖菜品命名个性化程度高,为运营分析、召回排序、后台管理等业务带来一定的困难。本文系外卖美食知识图谱系列的第二篇文章,介绍了外卖从零到一建设菜品标准化体系的过程及方案,涉及的主要技术包括NLP领域的实体抽取、文本匹配、关系分类,以及CV领域的图像匹配等。最后,通过标准名在外卖业务中的应用实践,验证了标准名体系建设的价值和意义。 阅读全文

美团外卖美食知识图谱的迭代及应用

杨林 郭同 海超 懋地
菜品是外卖交易过程的核心要素,对菜品的理解也是实现外卖供需匹配的重点。今天我们将一次推送三篇文章,系统地介绍了美团外卖美食知识图谱的构建和应用。《美团外卖美食知识图谱的迭代及应用》会介绍外卖知识图谱的体系全貌,包括菜品类目、标准菜品、美食基础属性和美食业务主题属性。《外卖商品的标准化建设与应用》将重点介绍外卖菜品标准化建设思路、技术方案和业务应用。由于外卖的业务特点是搭配成单,而《外卖套餐搭配的探索和应用》一文会针对性地介绍外卖套餐搭配技术的迭代以及应用实践。希望对从事相关工作的同学能够带来一些启发或者帮助。 阅读全文

CIKM 2020 | 一文详解美团6篇精选论文

搜索与NLP中心
AI平台/搜索与NLP部/NLP中心/知识图谱组共有六篇论文(其中4篇长文,2篇短文)被国际会议CIKM2020接收,这些论文是知识图谱组在多模态知识图谱、MT-BERT、Graph Embedding和图谱可解释性等方向上的技术沉淀和应用。 阅读全文

MT-BERT在文本检索任务中的实践

兴武
提高机器阅读理解(MRC)能力以及开放领域问答(QA)能力是自然语言处理(NLP)领域的一大重要目标。在人工智能领域,很多突破性的进展都基于一些大型公开的数据集。 阅读全文

美团搜索中NER技术的探索与实践

丽红,星池,燕华,马璐,廖群,志安,刘亮,李超,云森,永超等
NER是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要的地位。 阅读全文

智能搜索模型预估框架Augur的建设与实践

朱敏,紫顺,乐钦,洪晨,乔宇,武进,孝峰,俊浩等
本文将与大家探讨美团搜索与NLP部使用的统一在线预估框架Augur的设计思路、效果、优势与不足,希望对大家有所帮助或者启发。 阅读全文

BERT在美团搜索核心排序的探索和实践

李勇 佳昊 杨扬 金刚 周翔 朱敏等
为进一步优化美团搜索排序结果的深度语义相关性,提升用户体验,搜索与NLP部算法团队从2019年底开始基于BERT优化美团搜索排序相关性,经过三个月的算法迭代优化,离线和线上效果均取得一定进展。本文主要介绍探索过程以及实践经验。 阅读全文

Transformer 在美团搜索排序中的实践

肖垚
近年来,BERT等Transformer模型大放异彩,在搜索推荐系统应用也成为业界潮流。美美今天介绍的这篇文章,将分享Transformer在美团搜索排序上的实践经验。 阅读全文

WSDM Cup 2020检索排序评测任务第一名经验总结

帅朋
美团搜索与NLP部与国内高校组队,提出了一种基于BERT和LightGBM的多模融合检索排序解决方案,拿下了WSDM Cup 2020 Task 1榜单的第一名,本文系经验总结文章。 阅读全文

美团BERT的探索和实践

杨扬 佳昊 金刚
2018年,自然语言处理(Natural Language Processing,NLP)领域最激动人心的进展莫过于预训练语言模型,包括基于RNN的ELMo和ULMFiT,基于Transformer的OpenAI GPT及Google BERT等。 阅读全文

大众点评信息流基于文本生成的创意优化实践

忆纯 杨肖 明海 众一 扬威 凤阳
本文主要介绍了大众点评信息流内容团队利用文本生成技术在创意优化方向上的一些思考和实践。 阅读全文

WSDM Cup 2019自然语言推理任务获奖解题思路

帅朋
美团团队在刚刚结束的WSDM Cup 2019比赛“真假新闻甄别任务”中获得了第二名的好成绩。本文将详细介绍他们本次获奖的解决方案,里面用到了很多黑科技比如BERT哦。 阅读全文

人物志 | MIT 科技创新“远见者”:美团 NLP 负责人王仲远

王鹏
2019 年 1 月 21 日,《麻省理工科技评论》发布了 2018 年“35 岁以下科技创新 35 人”(35 Innovators Under 35)中国榜单,美团点评AI平台部 NLP 中心负责人、点评搜索智能中心负责人王仲远获评为“远见者”。 阅读全文