答案:(1)YARN:HADOOP 2.X之后引入的资源管理和调度器,可以在YARN上运行各种不同类型的执行框架,如MAPREDUCE、SPARK、TEZ。
(2)MAPREDUCE:分布式并行编程模型。
(3)SPARK:基于内存的通用并行编程框架。
(4)HIVE:HADOOP中的数据仓库,定义了一种类似SQL的查询语言(HQL),将SQL转化为MAPREDUCE任务在HADOOP上执行 。
(5)HBASE:是一个建立在HDFS之上,面向列的针对结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。
(6)FLUME:数据采集