Hadoop学习笔记(3)--Hive

Hive是建立在Hadoop上的数据仓库基础构架。
它提供了一系列的工具，用来进行数据提取、转化、加载，这是一种可以存储
、查询和分析存储在Hadoop中的大规模数据的机制。

根据管理层次

Hive将元数据存储在RDBMS中，有三种模式可以连接到数据库：

MetaStoreServer，客户端利用Thrift协议通过MetaStoreServer来访问元数据库。

Hive没有专门的数据存储格式，也没有为数据建立索引，用户可以非常自由地组织Hive中的表，只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符，它就可以解析数据了。

Hive中所有的数据都存储在HDFS中，Hive中包含4种数据模型：Table、External Table、Partition和Bucket。

数据交换主要分为以下几部分，

原文链接：Hadoop学习笔记(3)--Hive，转载请注明来源！