文章列表

TensorFlow在美团外卖推荐场景的GPU训练优化实践

家恒 国庆等
美团机器学习平台基于内部深度定制的TensorFlow研发了Booster GPU训练架构。该架构在整体设计上充分考虑了算法、架构、新硬件的特性,从数据、计算、通信等多个角度进行了深度的优化,最终其性价比达到CPU任务的2~4倍。本文主要讲述Booster架构的设计实现、性能优化及业务落地工作,希望能对从事相关开发的同学有所帮助或者启发。 阅读全文

TensorFlow在推荐系统中的分布式训练优化实践

逸帆 家恒 峥少 鹏鹏 永宇 正阳 黄军
美团内部深度定制的TensorFlow版本,基于原生TensorFlow 1.x架构与接口,从大规模稀疏参数的支持、训练模式、分布式通信优化、流水线优化、算子优化融合等多维度进行了深度优化。在推荐系统场景,分布式扩展性提升10倍以上,单位算力性能也有显著提升,并在美团内部业务中大量使用,本文介绍了相关的优化与实践工作。 阅读全文

新一代CTR预测服务的GPU优化实践

伟龙 小卓 文魁 駃飞 小新
CTR模型在互联网的搜索、推荐、广告等场景有着广泛的应用。近年来,随着深度神经网络的引入,CTR模型的推理对硬件算力的要求逐渐增加。本文介绍了美团在CTR模型优化的实践。通过分析模型结构特点,结合GPU硬件架构,我们设计了一系列流程对模型进行定制优化,达到了降低延迟、提高吞吐、节省成本的目标。 阅读全文

AI Challenger 2018:细粒度用户评论情感分析冠军思路总结

程惠阁
2018年8月-12月,由美团点评、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”历经三个多月的激烈角逐,冠军团队从来自全球81个国家、1000多所大学和公司的过万支参赛团队中脱颖而出。 阅读全文

强化学习在美团“猜你喜欢”的实践

段瑾
介绍强化学习在美团推荐排序中的应用,包括三个部分:多模型融合的MDP设计奠定了取得收益的基础;针对强化学习鲁棒性和样本利用效率较低的问题,改进DDPG模型使线上取得稳定收益;基于TensorFlow的轻量级实时DRL框架为快速迭代实验提供了保障。 阅读全文

基于TensorFlow Serving的深度学习在线预估

仲达 鸿杰 廷稳
本文主要介绍在生产环境下,如何使用TensorFlow Serving部署深度学习预估服务;同时为了满足线上性能要求,我们对TensorFlow底层原理以及性能优化做了进一步的讨论,最终实现了高性能的要求。 阅读全文

深度学习在美团搜索广告排序的应用实践

薛欢 姚强 玉林 王新
本文将介绍搜索广告业务中排序模型的探索以及服务优化。 阅读全文

使用TensorFlow训练WDL模型性能问题定位与调优

郑坤
我们在Hadoop集群上使用分布式TensorFlow的实践中,定位发现了一些系统性能瓶颈导致WDL模型训练速度慢。通过分析瓶颈根源和相应的调优手段,WDL模型训练性能提升10倍左右,同时我们对TensorFlow框架和WDL模型也有了更深刻的理解。 阅读全文