hive怎么处理大数据

如题所述

举报该问题

推荐答案 2018-10-25

Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据上，提供命令行工具和JDBC驱动程序，用于将用户连接到Hive。最适用于传统的数据仓库任务。

Hive优势在于处理大数据，因为hive的执行延迟比较高。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://33.wendadaohang.com/zd/R5d4P5BPdhBWW4hPhcB.html

其他回答

第1个回答 2018-10-25

Hive只在一个节点上安装即可
1.上传tar包
2.解压
tar -zxvf hive-0.9.0.tar.gz -C /cloud/
3.配置mysql metastore（切换到root用户）
配置HIVE_HOME环境变量
rpm -qa | grep mysql
rpm -e mysql-libs-5.1.66-2.el6_3.i686 --nodeps
rpm -ivh MySQL-server-5.1.73-1.glibc23.i386.rpm
rpm -ivh MySQL-client-5.1.73-1.glibc23.i386.rpm
修改mysql的密码
/usr/bin/mysql_secure_installation
（注意：删除匿名用户，允许用户远程连接）
登陆mysql
mysql -u root -p
4.配置hive
cp hive-default.xml.template hive-site.xml
修改hive-site.xml（删除所有内容，只留一个<property></property>）
添加如下内容：
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop00:3306/hive?createDatabaseIfNotExist=true</value>
<description>JDBC connect string for a JDBC metastore</description>
</property>

相似回答

hive是什么答：二、Hive的工作方式 Hive的工作方式与传统数据库有所不同。传统数据库通常通过执行预编译的SQL语句来处理数据，而Hive则是在执行查询时动态编译HQL。这意味着Hive更适合处理批量数据，而不是实时数据。另外，Hive还支持用户自定义函数（UDFs），使得用户可以更方便的处理和分析数据。三、Hive的优点和应用场...

hive是什么答：由于其支持SQL查询和强大的数据处理能力，Hive成为企业处理海量数据的首选工具之一。企业可以使用Hive进行实时数据分析、数据挖掘、商业智能等应用，帮助决策者做出更明智的决策。此外，Hive还可以与其他大数据工具和技术集成，如HBase、Pig等，以满足不同的数据处理和分析需求。总的来说，Hive是一个构建在Hado...

大数据Hive仓库是什么?答：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射成一张表，并提供类SQL查询功能；其本质是将HQL转化成MapReduce程序。构建在Hadoop之上的数据仓库：使用HQL作为查询接口使用HDFS存储使用MapReduce计算灵活性和扩展性比较好：支持UDF，自定义存储格式等：适合离线数据处理 ...

大家正在搜

hive表数据过大怎么读大数据hadoophive 大数据 hive hive大数据分析如何用hive来做大数据测试大数据hive面试 hive中超大数据量表关联查询数据挖掘和大数据区别大数据分析数据仓库面试题