文章列表

Spark向量化计算在美团生产环境的实践

luhao 左军 lux等
Apache Spark是一个优秀的计算引擎,广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下,既可获得资源节省和加速作业执行。Gluten+Velox解决方案为Spark换上了向量化执行引擎,本文将阐述美团在这一方向的实践和思考,希望对大家有所帮助或启发。 阅读全文

美团图数据库平台建设及业务实践

登昌 梁帅 高辰 杨鑫 尊远 王超
美团有比较多的图数据存储及多跳查询需求,亟需一种组件来对千亿量级图数据进行管理。海量图数据的高效存储和查询是图数据库研究的核心课题,如何在大规模分布式场景中进行工程落地是我们面临的痛点问题。下面介绍美团在图数据库选型及平台建设方面的一些工作。 阅读全文

Spark性能优化指南——高级篇

李雪蕤
想要用好Spark,就必须进行合理的性能优化,才能充分发挥出它的优势。本文主要讲解了笔者实际工作中积累的Spark性能优化方案的高级内容,包括数据倾斜调优和shuffle调优。 阅读全文

Spark性能优化指南——基础篇

李雪蕤
想要用好Spark,就必须进行合理的性能优化,才能充分发挥出它的优势。本文主要讲解了笔者实际工作中积累的Spark性能优化方案中的基础内容,包括开发调优以及资源调优。 阅读全文

Spark在美团的实践

曾林西 李雪蕤 秦思源 毕岩 黄忠
介绍Spark在美团的实践,包括我们基于Spark所做的平台化工作,以及Spark在生产环境下的应用案例。 阅读全文