随笔 - 175  文章 - 202  trackbacks - 0
<2010年11月>
31123456
78910111213
14151617181920
21222324252627
2829301234
567891011

第一个Blog,记录哈哈的生活

常用链接

留言簿(16)

随笔分类

随笔档案

文章分类

文章档案

收藏夹

Java links

搜索

  •  

最新评论

阅读排行榜

评论排行榜

一、简介

       SQL*LOADERORACLE的数据加载工具,通常用来将操作系统文件迁移到ORACLE数据库中。SQL*LOADER是大型数据仓库选择使用的加载方法,因为它提供了最快速的途径(DIRECTPARALLEL)。使用前提是必须存在目标表。

二、SQL*LOADER使用方法

    Window系统下,SQL Loader的命令为sqlldr,在UNIX下一般为sqlldr/sqlload

有效的关键字:   
userid   --   ORACLE   用户名/口令   
control   --   控制文件名  
log   --   日志文件名 
bad   --   错误文件名,如果有的数据没有被处理,将会出现在这里   
data   --   数据文件名  
discard   --   废弃文件名 
discardmax   --   允许丢弃数据的数目   (全部默认)   
skip   --   要跳过的逻辑记录的数目   (默认0)   
load   --   要加载的逻辑记录的数目   (全部默认)   
errors   --   允许的错误记录数目  (默认50)   
rows   --   常规路径绑定数组中或直接路径保存数据间的行数  (默认:   常规路径   64,   所有直接路径)   
bindsize   --    常规路径绑定数组的大小,以字节计算(默认65536)   
silent   --   运行过程中隐藏的信息   (header,feedback,errors,discards,partitions)   
direct   --   使用直接路径   (默认FALSE)   
parfile   --   参数文件:包含参数说明的文件的名称
parallel   --   执行并行加载   (默认FALSE)   

file -- 要从以下对象中分配区的文件
skip_unusable_indexes -- 不允许/允许使用无用的索引或索引分区  (默认 FALSE)
skip_index_maintenance -- 没有维护索引, 将受到影响的索引标记为无用  (默认 FALSE)

commit_discontinued -- 提交加载中断时已加载的行  (默认 FALSE)
readsize -- 读取缓冲区的大小               (默认 1048576)
external_table -- 使用外部表进行加载; NOT_USED, GENERATE_ONLY, EXECUTE  (默认 NOT_USED)
columnarrayrows -- 直接路径列数组的行数  (默认 5000)
streamsize -- 直接路径流缓冲区的大小 (以字节计)  (默认 256000)
multithreading -- 在直接路径中使用多线程
resumable -- 启用或禁用当前的可恢复会话  (默认 FALSE)
resumable_name -- 有助于标识可恢复语句的文本字符串
resumable_timeout -- RESUMABLE 的等待时间 (以秒计)  (默认 7200)
date_cache -- 日期转换高速缓存的大小 (以条目计)  (默认 1000)

PLEASE NOTE: 命令行参数可以由位置或关键字指定。前者的例子是 'sqlload scott/tiger foo'; 后一种情况的一个示例是 'sqlldr control=foo userid=scott/tiger'.位置指定参数的时间必须早于但不可迟于由关键字指定的参数。例如,允许 'sqlldr scott/tiger control=foo logfile=log', 但是不允许 'sqlldr scott/tiger control=foo log', 即使参数 'log' 的位置正确。

三、SQL*LOADER实例

控制文件脚本实例:

load data    --控制文件表示
infile 'e:\aa.csv'    --有导入的数据文件名
append into table TBL_SYNC_CORE_INSURANCE    --向表TBL_SYNC_CORE_INSURANCE中追加记录
fields terminated by ','  --指定用逗号分隔
OPTIONALLY ENCLOSED BY '"'
TRAILING NULLCOLS  
--表的字段没有对应值时允许为空
*************下面是表的字段
(
  COVERAGE_CODE,
  PRODUCT_NO,
  NAME,
  MAIN_COVERAGE_CODE,
  KIND,
  CREATOR,
  CREATED_DATE,
  MODIFIER,
  MODIFIED_DATE
)

      备注:数据导入的方式上例中用的append,有一下几种:insert,为缺省方式,在数据装载开始时要求表为空;append,在表中追加新记录;replace,删除旧记录,替换成新装载的记录   ;truncate,同replace,会用truncate语句删除现存数据

      在命令行提示符下使用SQL*Loader命令实现数据的输入:

      sqlldr   userid=用户名/口令@服务名   control='e:\control.ctl'   log=e:\log.txt   bad=e:\bad.txt

      如果本地安装了oracle服务端,可以不写服务名;log和bad不写,默认生成在当前目录下。

四、其他导入方法

      利用PLSQL   Developer:

      在单个文件不大的情况下(少于100000行),并且目的表结构已经存在的情况下-----对于excel而言肯定不会超过了,因为excel文件的最大行为65536-----可以全选数据COPY   ,然后用PLSQL   Developer工具。

      1   在PLSQL   Developer的sql   window里输入select   *   from   test   for   update;   
      2   按F8执行;
      3   打开锁,   再按一下加号.   鼠标点到第一列的列头,使全列成选中状态,然后粘贴,最后COMMIT提交即可。

五、补充在Linux下使用 sqlldr 的注意事项

在执行 sqlldr 前,需要进行以下步骤

  1. 设置 ORACLE_HOME 环境变量,如 export ORACLE_HOME=/usr/lib/oracle/xe/app/oracle/product/10.2.0/server
  2. 设置ORACLE编码格式,将本地字符集和ORACLE字符集设置为一致,如export NLS_LANG="SIMPLIFIED CHINESE_CHINA.AL32UTF8"
  3. 将csv文件转码成相应的编码

然后再使用 sqlldr 进行数据导入

posted on 2010-11-07 15:42 哈哈的日子 阅读(4133) 评论(0)  编辑  收藏

只有注册用户登录后才能发表评论。


网站导航: