关系型数据库导入导出绝招出炉
admin
2023-05-29 12:21:29
0

Sqoop作为数据传输的工具,对于Hadoop与传统数据库之间数据的传输起着桥梁作用,那么到底如何导入导出数据呢?

第一:使用MapReduce作业来执行导入:

1Sqoop首先检查将要导入的表

1、确定主键(如果有的话),调用mapreduce,根据主键分割map

2、没有主键,运行边界查询确定导入的记录数(找到一个min和一个max,确定边界进行划分)

3、通过任务数来划分边界查询的结果,使得他们有相同的负载

2Sqoop为每个将导入的表生成Java源文件

1、在导入过程中编译和使用文件

2、导入后依然保留,可以被安全删除

第二:使用sqoop导入整个数据库:

(1)import-all-tables工具导入整个数据库

1、存储为逗号间隔的文件

2、默认导入到HDFShome目录

3、数据将放在每个表的子目录中

关系型数据库导入导出绝招出炉

2)使用--warehouse-dir选项指定不同的基础目录关系型数据库导入导出绝招出炉

第三:使用Sqoop导入单个表:

1import工具导入单个表

1、示例:导入accounts

以逗号分隔的方式存储数据到HDFS

关系型数据库导入导出绝招出炉

2、指定tab分隔字段

关系型数据库导入导出绝招出炉

第四:增量导入

(1)  如果上次记录导入后发生了变更怎么办?

1、可以重新导入所有记录,但是效率低

(2)  Sqooplastmodified增量模式导入新的和修改的记录

1、基于指定的timestamp

2、确保当记录更新或者被添加时timestamp也更新

关系型数据库导入导出绝招出炉

(3)append增量模式只导入新纪录

1、基于指定列的最后一条记录

关系型数据库导入导出绝招出炉

第五:使用SqoopHadoop导出数据到RDBMS

1Sqoopimport工具把数据从RDBMS拉入到HDFS

2)有时候也需要把HDFS的数据推回到RDBMS,当需要对大数据集进行批处理,并导出结果到RDBMS供其它系统访问

3Sqoop使用export工具RDBMS表在导出前必须已存在

关系型数据库导入导出绝招出炉

掌握了以上方式,对于关系型数据库的导入和导出基本有一个明确的认知和了解,其实我们在日常的学习和实践过程中要多去看看别人的分享,毕竟做技术每个人的经历与经验不一样,有时候说不准会有意向不到的收获。我自己平时喜欢关注“大数据cn”、“大数据时代学习中心”这些微信服务号,对于我个人而言,起到了很大的促进作用,也期待每一个学习大数据的人都能够有所收获!


相关内容

热门资讯

胡锡进:我不认为特朗普真的能与... 特朗普周三表示,他将与赖清德就对台军售问题进行对话,引起轩然大波。周三,在被记者问到他是否计划就美国...
台北市选情突变:白营曾妍洁退党... 海峡导报综合报道 2026年底台湾地区“九合一”选举临近,岛内各政党积极部署。在国民党传统优势选区的...
空调室外机不转怎么办 如果是因为空调设置错了导致不转,那么可以重新调成正确的模式;如果是因为电源出现故障,那么可以重新插一...
防溅水龙头里面是怎么安的 安装防溅水龙头时,首先我们需要准备好工具:扳手、生料带、防溅水龙头。先将总闸关闭,以免在拆卸原先的水...
安卓手机怎么安装Adobe F... 安卓手机用户可能有时候看不了一些flash动画或者视频。那么安卓手机怎么安装Adobe Flash ...
博士洗衣机的洗涤专用盒A怎么安 1、首先要了解博士洗衣机是哪种型号的。依照小格子中的标注为“1”,此格用做预添加洗衣液,当选择带有预...
燃气灶安不上怎么办 如果您在安装燃气灶时遇到困难或问题,以下是一些可能的解决方案:1.检查燃气管线:首先检查燃气管线是否...
以开放合作释放科技革命潜能 5月18日,由中国贸促会主办的2026年全球贸易投资促进峰会在北京举行。中外与会代表围绕“新质生产力...
“6G网要来了”! 4G实现的是人人通信,5G是人机物通信,而6G将实现人、机、物、灵的通信——“灵”,即具有自主学习、...