如何实现hadoop系统与Oracle数据库的数据共享

如题所述

第1个回答 2017-09-26

您好，很高兴为您解答。通过Map/Reduce进行批处理递送到ApacheHadoop仍然是中枢环节。,但随着要从“超思维速度“分析方面获取竞争优势的压力递增，因此Hadoop(分布式文件系统)自身经历重大的发展。科技的发展允许实时查询，如ApacheDrill,ClouderaImpala和StingerInitiative正脱颖而出，新一代的资源管理ApacheYARN支持这些。为了支持这种日渐强调实时性操作,发布一个新MySQLApplierforHadoop(用于Hadoop的MySQLApplier)组件。它能够把MySQL中变化的事务复制到Hadoop/Hive/HDFS。Applier组件补充现有基于批处理ApacheSqoop的连接性。这个组件(MySQLApplierforHadoop)的复制是通过连接MySQL主服务，一旦二进制日志被提交，就读取二进制日志事务，并且把它们写到HDFS.这个组件使用libhdfs提供的API，一个C库操作HDFS中的文件。这库由Hadoop版本预编译生成的。它连接MySQL主服务读二进制日志，然后提取发生在主服务上的行插入事件，解码事件,提取插入到行的每个字段的数据,并使用满意的处理程序得到被要求的格式数据。把它追加到HDFS中一个文本文件。数据库被映射为单独的目录,它们的表映射为子目录，保存在数据仓库目录。每个表的数据被写到Hive/HDFS中文本文件(称为datafile1.txt)。数据可以用逗号格式分隔;或其他格式,那可用命令行参数来配置的。如若满意，请点击右侧【采纳答案】，如若还有问题，请点击【追问】希望我的回答对您有所帮助，望采纳！~O(∩_∩)O~

相似回答

如何将Oracle数据库中的数据导入到hbase中答：使用sqoop工具。1、在行键选择那里，通过用“”，将需要做行键的多个列写在一起就可以了。2、例如要将a和b列同时做行键，那么--hbase-row-key "a,b"就可以了。Sqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递，可以将一个关系型数据库（...

两台服务器的数据同步如何实现?答：1.安装CentOS7.0yum install ssh 安装SSH协议yum install rsync （rsync是一个远程数据同步工具，可通过LAN/WAN快速同步多台主机间的文件）service sshd restart 启动服务任务 2.配置Master无密码登录所有Salve，在Master机器上生成密码对 3.查看/home/hadoop/下是否有".ssh"文件夹，且".ssh"文件下是否...

hadoop与传统的关系型数据库(如oracle)相比,有什么优势及劣势?_百度...答：hadoop的hdfs支持海量数据量存储 mapreduce支持对海量数据的分布式处理\x0d\x0aoracle虽然可以搭建集群但是当数据量达到一定限度之后查询处理速度会变得很慢且对机器性能要求很高\x0d\x0a其实这两个东西不是同类 hadoop是一个分布式云处理架构，倾向于数据计算而oracle是一个关系型数据库...

大家正在搜

数据库可以实现数据共享吗 hadoop与传统数据库 hadoop与数据库的区别数据库的数据可以共享对不对数据库特点之一是数据的共享数据库中的数据不可以共享基于hadoop开发自己的数据库数据库数据共享 hadoop是数据库吗