exp/imp与expdp/impdp区别_MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  MySQL, Oracle及数据库讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 3711 | 回复: 0   主题: exp/imp与expdp/impdp区别        下一篇 
大红薯
注册用户
等级:少校
经验:1440
发帖:159
精华:0
注册:2011-7-21
状态:离线
发送短消息息给大红薯 加好友    发送短消息息给大红薯 发消息
发表于: IP:您无权察看 2011-8-1 14:16:57 | [全部帖] [楼主帖] 楼主

一、用法区别

1:把用户usera的对象导到用户userb,用法区别在于fromuser=usera touser=userb ,remap_schema='usera':'usera' 。例如:imp system/passwd fromuser=usera touser=userb file=/oracle/exp.dmp log=/oracle/exp.log;

#q N8lKp`0impdp system/passwd directory=expdp dumpfile=expdp.dmp remap_schema='usera':'userb' logfile=/oracle/exp.log;ITPUB个人空间;l bDf
S;y


:PL L6FM:wYFD02:更换表空间,用exp/imp的时候,要想更改表所在的表空间,需要手工去处理一下,
V6r,NF L%t U-m0如alter table xxx move tablespace_new之类的操作。
*D+|ML Y5G*Z2w%z0用impdp只要用remap_tablespace='tabspace_old':'tablespace_new'ITPUB个人空间[1]h!\‑][1Wi6J

LO0L


?V YQRn+[03:当指定一些表的时候,使用exp/imp 时,tables的用法是 tables=('table1','table2','table3')。ITPUB个人空间:K,f!xo YW"P
expdp/impdp的用法是tables='table1','table2','table3'ITPUB个人空间p9tv~­p
ITPUB个人空间Zw


Mc2F
?$l
4:是否要导出数据行

:m*@9m3cS ko0exp (ROWS=Y 导出数据行,ROWS=N 不导出数据行)
D1UjW!x G0expdp content(ALL:对象+导出数据行,DATA_ONLY:只导出对象,METADATA_ONLY:只导出数据的记录)


5:expdp是10g的新特性而且只能在服务器执行。而exp/imp是通用的。

二、效率比较

测试条件:单个表测试,1363292行记录,116.6 MB左右数据量。

使用并行expdp花费时间约43秒,语句:expdp scott/oracle dumpfile=big_table.dmp directory=dpdata tables=big_table job_name=exptab parallel=4

使用正常的expdp(无parallel=4),花费时间约34秒,并行的差异可能需要更大数据量的测试。

exp直接路径导出约71秒,语句:exp scott/oracle file=big_table3.dmp tables=big_table direct=yITPUB个人空间

D,@1m5z  Mi


exp常规路径(无direct=y)导出,约126秒,花费时间最长。

从效率比较上看,expdp是一般exp的4倍左右。而导出的文件大小,传统方式exp文件要大于expdp的文件大小,大约大出10M左右。

3.1  DATA PUMP的性能提升方面
       1)可有多个进程的并行机制,以直接路径的流方式同时装载或者下载表。
       2)对于非常大的表格和分区,单个的进程可以选择内部分区并行机制,以多个并行查询结合多个DML I/O服务进程结合的方式进行操作(就是处理外部表的方式)。
       3) 使用并行机制来建立索引和包体,还是并行。
       4) 是在服务器上直接读写的(省略了很多网络操作还有其它一些耗费cpu的过程,所以这也就是为什么一直只能限制使用direcotry object的缘故)。
       5)文件的存储格式是 direct path API内部流格式。而这种格式和oracle数据文件的格式非常像,因此不需要进行客户端INSERT语句的转换(不是非常明白)?
       6) 更好的存储方法:直接路径和外表存取(direct path /external tables),比常规的sql来得快。直接路径提供了最快的单数据流性能,而外表方式有效地利用了数据库并行查询和并行dml操作能力。
       7)在导出过程中,元数据和数据的抽取过程是可以交替进行的。这个的意思大概是两者的导出是可以分离的,不需要一个依赖另外一个,而以前的过程需要先元数据再数据。

3.2 性能调整
       DATA PUMP技术完全地利用可利用的资源来最大化吞吐量,最小化任务的时间。为了达到这个目的,一个系统必须在CPU,内容,I/O方面进行很好的平衡处理。此外,标准的性能调整规则也应该使用到。例如,为了最好的性能,数据文件应该存放在不同的磁盘上,因为进程会并行读写这些文件。同样地,源表空���或者目标表空间应该是位于不同的磁盘上(这样才能有效地利用到并行i/o的性能)。
3.3 控制资源的消耗
       DATA PUMP工具允许我们动态调整任务的资源消耗(增加或者减少),这是通过parallel参数来控制的。为了最大化吞吐量,应该只给每个CPU分配两个工作进程。
       当我们提高了并行度的时候,CPU,内存,I/O带宽的使用也提升了。我们必须确保这些系统资源是够用的,只要有必要,应该把文件分散到不同磁盘或者通道上以便获得更好的i/o带宽。
       为了最大化并行机制,至少必须给每个并行度提供一个文件,这样做最简单的办法就是使用文件统配符号%U.当然这些都取决于你的磁盘配置(例如单个的,非条带磁盘),你应该不会希望把所有的文件放在同个磁盘上。即使有很快的CPU和很快的磁盘,CPU和磁盘之间的通道依然可能成为并行机制的约束因素。
       PARALLEL参数只能在企业版中使用。



赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论