想要用好Spark,就必须进行合理的性能优化,才能充分发挥出它的优势。本文主要讲解了笔者实际工作中积累的Spark性能优化方案的高级内容,包括数据倾斜调优和shuffle调优。 阅读全文