Spark 学习日记(初探)

hadoop 1.x HDFS:用 NameNode 管理 DataNode。 Map-Reduce:用 JobTracker 管理(调度) TaskTracker hadoop 1.x Map-Reduce 的缺点 Map-Reduce 是基于数据集的计算,是面向数据的。 基本的运算规则从介质中获取,计算后再存储到介质中。所以主要应用于一次性计算。在当前的大数据环境 ...