如何将mysql数据导入hadoop

如题所述

推荐答案 2016-07-19

å®æsqoopçå®è£åï¼å¯ä»¥è¿æ ·æµè¯æ¯å¦å¯ä»¥è¿æ¥å°mysql(æ³¨æï¼mysqlçjaråè¦æ¾å° SQOOP_HOME/lib ä¸)ï¼

sqoop list-databases --connect jdbc:mysql://192.168.1.109:3306/ --username root --password 19891231

ç»æå¦ä¸

å³è¯´æsqoopå·²ç»å¯ä»¥æ£å¸¸ä½¿ç¨äºã

ä¸é¢ï¼è¦å°mysqlä¸çæ°æ®å¯¼å¥å°hadoopä¸ã

æåå¤çæ¯ä¸ä¸ª300ä¸æ¡æ°æ®çèº«ä»½è¯æ°æ®è¡¨ï¼

åå¯å¨hiveï¼ä½¿ç¨å½ä»¤è¡ï¼hive å³å¯å¯å¨ï¼

ç¶åä½¿ç¨sqoopå¯¼å¥æ°æ®å°hiveï¼

sqoop import --connect jdbc:mysql://192.168.1.109:3306/hadoop --username root --password 19891231 --table test_sfz --hive-import

sqoop ä¼å¯å¨jobæ¥å®æå¯¼å¥å·¥ä½ã

å®æå¯¼å¥ç¨äº2å20ç§ï¼è¿æ¯ä¸éçã

å¨hiveä¸å¯ä»¥çå°ååå¯¼å¥çæ°æ®è¡¨ï¼

æä»¬æ¥ä¸å¥sqlæµè¯ä¸ä¸æ°æ®ï¼

select * from test_sfz where id < 10;

å¯ä»¥çå°ï¼hiveå®æè¿ä¸ªä»»å¡ç¨äºå°è¿25ç§ï¼ç¡®å®æ¯æºæ¢çï¼å¨mysqlä¸å ä¹æ¯ä¸è´¹æ¶é´ï¼ï¼ä½æ¯è¦èèå°hiveæ¯åå»ºäºjobå¨hadoopä¸è·ï¼æ¶é´å½ç¶å¤ã

æ¥ä¸æ¥ï¼æä»¬ä¼å¯¹è¿äºæ°æ®è¿è¡å¤ææ¥è¯¢çæµè¯ï¼

ææºåçéç½®å¦ä¸ï¼

hadoop æ¯è¿è¡å¨èææºä¸çä¼ªåå¸å¼ï¼èææºOSæ¯ubuntu12.04 64ä½ï¼éç½®å¦ä¸ï¼

TEST 1 è®¡ç®å¹³åå¹´é¾

æµè¯æ°æ®ï¼300.8 W

1. è®¡ç®å¹¿ä¸çå¹³åå¹´é¾

mysqlï¼select (sum(year(NOW()) - SUBSTRING(borth,1,4))/count(*)) as ageAvge from test_sfz where address like 'å¹¿ä¸%';

ç¨æ¶ï¼ 0.877s

hiveï¼select (sum(year('2014-10-01') - SUBSTRING(borth,1,4))/count(*)) as ageAvge from test_sfz where address like 'å¹¿ä¸%';

ç¨æ¶ï¼25.012s

2. å¯¹æ¯ä¸ªåå¸ççå¹³åå¹´é¾è¿è¡ä»é«å°ä½çæåº

mysqlï¼select
address, (sum(year(NOW()) - SUBSTRING(borth,1,4))/count(*)) as ageAvge
from test_sfz GROUP BY address order by ageAvge desc;

ç¨æ¶ï¼2.949s

hiveï¼select
address, (sum(year('2014-10-01') - SUBSTRING(borth,1,4))/count(*)) as
ageAvge from test_sfz GROUP BY address order by ageAvge desc;

ç¨æ¶ï¼51.29s

å¯ä»¥çå°ï¼å¨èæ¶ä¸é¢ï¼hiveçå¢é¿éåº¦è¾mysqlæ¢ã

TEST 2

æµè¯æ°æ®ï¼1200W

mysql å¼æï¼ MyISAMï¼ä¸ºäºå å¿«æ¥è¯¢éåº¦ï¼

å¯¼å¥å°hiveï¼

1. è®¡ç®å¹¿ä¸çå¹³åå¹´é¾

mysqlï¼select (sum(year(NOW()) - SUBSTRING(borth,1,4))/count(*)) as ageAvge from test_sfz2 where address like 'å¹¿ä¸%';

ç¨æ¶ï¼ 5.642s

hiveï¼select (sum(year('2014-10-01') - SUBSTRING(borth,1,4))/count(*)) as ageAvge from test_sfz2 where address like 'å¹¿ä¸%';

ç¨æ¶ï¼168.259s

2. å¯¹æ¯ä¸ªåå¸ççå¹³åå¹´é¾è¿è¡ä»é«å°ä½çæåº

mysqlï¼select
address, (sum(year(NOW()) - SUBSTRING(borth,1,4))/count(*)) as ageAvge
from test_sfz2 GROUP BY address order by ageAvge desc;

ç¨æ¶ï¼11.964s

hiveï¼select
address, (sum(year('2014-10-01') - SUBSTRING(borth,1,4))/count(*)) as
ageAvge from test_sfz2 GROUP BY address order by ageAvge desc;

ç¨æ¶ï¼311.714s

温馨提示：答案为网友推荐，仅供参考

当前网址：http://33.wendadaohang.com/zd/cRR5BBcW5ddPd4B5dhW.html

其他回答

第1个回答 2016-07-19

用sqoop

sqoop job --create myjob -- import --connect jdbc:mysql://192.168.80.1:3306/hive --username root --password root --table tbls --fields-terminated-by '\t' --null-string '' --m 1 --check-column 'TBL_ID' --incremental append

第2个回答 2016-07-19

可以导入，太大，就不要用记事本或者其它编辑器打开了，
查询分析器－－连接数据库－－文件－－打开－－.sql文件－－F5执行

不过你把数据导出为SQL文件，而且200多M，真的是。。。。

为何不压缩后，直接拷库文件，或者直接备份导出呢。

相似回答

如何进行MySQL数据库与HDFS的实时数据同步答：这个组件使用libhdfs提供的API，一个C库操作HDFS中的文件。这库由Hadoop版本预编译生成的。它连接MySQL主服务读二进制日志，然后：提取发生在主服务上的行插入事件解码事件,提取插入到行的每个字段的数据,并使用满意的处理程序得到被要求的格式数据。把它追加到HDFS 中一个文本文件。数据库被映射为单独的...

用sqoop将mysql得表导入HDFS里,那么问题来了,这个表将会以什么格式存储...答：实现类如下：packagesqoop;importjava.util.ArrayList;importjava.util.List;importorg.apache.hadoop.conf.Configuration;importorg.apache.sqoop.Sqoop;importorg.apache.sqoop.tool.ExportTool;/***用SQOOP来把数据从HDFS导入到MYSQL。**/publicclassTest{publicstaticvoidmain(String[]args){ListgeneratedJars...

hbase导入导出方式有哪些答：1、Put API Put API可能是将数据快速导入HBase表的最直接的方法。但是在导入【大量数据】时不建议使用！但是可以作为简单数据迁移的选择，直接写个代码批量处理，开发简单、方便、可控强。2、MapReduce Job 推荐使用sqoop，它的底层实现是mapreduce，数据并行导入的，这样无须自己开发代码，过滤条件通过quer...

大家正在搜

oracle数据导入mysql hadoop导入mysql hadoopmysqlhdfs hadoopkafkamysql hadoop写入mysql mysql数据导入命令 hadoop有mysql hadoop用作mysql mysql和hadoop学哪个