一、简介
SQL*LOADER是ORACLE的数据加载工具,通常用来将操作系统文件迁移到ORACLE数据库中。SQL*LOADER是大型数据仓库选择使用的加载方法,因为它提供了最快速的途径(DIRECT,PARALLEL)。使用前提是必须存在目标表。
二、SQL*LOADER使用方法
在Window系统下,SQL Loader的命令为sqlldr,在UNIX下一般为sqlldr/sqlload。
有效的关键字:
userid -- ORACLE 用户名/口令
control -- 控制文件名
log -- 日志文件名
bad -- 错误文件名,如果有的数据没有被处理,将会出现在这里
data -- 数据文件名
discard -- 废弃文件名
discardmax -- 允许丢弃数据的数目 (全部默认)
skip -- 要跳过的逻辑记录的数目 (默认0)
load -- 要加载的逻辑记录的数目 (全部默认)
errors -- 允许的错误记录数目 (默认50)
rows -- 常规路径绑定数组中或直接路径保存数据间的行数 (默认: 常规路径 64, 所有直接路径)
bindsize -- 常规路径绑定数组的大小,以字节计算(默认65536)
silent -- 运行过程中隐藏的信息 (header,feedback,errors,discards,partitions)
direct -- 使用直接路径 (默认FALSE)
parfile -- 参数文件:包含参数说明的文件的名称
parallel -- 执行并行加载 (默认FALSE)
file -- 要从以下对象中分配区的文件
skip_unusable_indexes -- 不允许/允许使用无用的索引或索引分区 (默认 FALSE)
skip_index_maintenance -- 没有维护索引, 将受到影响的索引标记为无用 (默认 FALSE)
commit_discontinued -- 提交加载中断时已加载的行 (默认 FALSE)
readsize -- 读取缓冲区的大小 (默认 1048576)
external_table -- 使用外部表进行加载; NOT_USED, GENERATE_ONLY, EXECUTE (默认 NOT_USED)
columnarrayrows -- 直接路径列数组的行数 (默认 5000)
streamsize -- 直接路径流缓冲区的大小 (以字节计) (默认 256000)
multithreading -- 在直接路径中使用多线程
resumable -- 启用或禁用当前的可恢复会话 (默认 FALSE)
resumable_name -- 有助于标识可恢复语句的文本字符串
resumable_timeout -- RESUMABLE 的等待时间 (以秒计) (默认 7200)
date_cache -- 日期转换高速缓存的大小 (以条目计) (默认 1000)
PLEASE NOTE: 命令行参数可以由位置或关键字指定。前者的例子是 'sqlload scott/tiger foo';
后一种情况的一个示例是 'sqlldr control=foo
userid=scott/tiger'.位置指定参数的时间必须早于但不可迟于由关键字指定的参数。例如,允许 'sqlldr
scott/tiger control=foo logfile=log', 但是不允许 'sqlldr scott/tiger
control=foo log', 即使参数 'log' 的位置正确。
三、SQL*LOADER实例
控制文件脚本实例:
load data --控制文件表示
infile 'e:\aa.csv' --有导入的数据文件名
append into table TBL_SYNC_CORE_INSURANCE --向表TBL_SYNC_CORE_INSURANCE中追加记录
fields terminated by ',' --指定用逗号分隔
OPTIONALLY ENCLOSED BY '"'
TRAILING NULLCOLS --表的字段没有对应值时允许为空
*************下面是表的字段
(
COVERAGE_CODE,
PRODUCT_NO,
NAME,
MAIN_COVERAGE_CODE,
KIND,
CREATOR,
CREATED_DATE,
MODIFIER,
MODIFIED_DATE
)
备注:数据导入的方式上例中用的append,有一下几种:insert,为缺省方式,在数据装载开始时要求表为空;append,在表中追加新记录;replace,删除旧记录,替换成新装载的记录 ;truncate,同replace,会用truncate语句删除现存数据。
在命令行提示符下使用SQL*Loader命令实现数据的输入:
sqlldr userid=用户名/口令@服务名 control='e:\control.ctl' log=e:\log.txt bad=e:\bad.txt
如果本地安装了oracle服务端,可以不写服务名;log和bad不写,默认生成在当前目录下。
四、其他导入方法
利用PLSQL Developer:
在单个文件不大的情况下(少于100000行),并且目的表结构已经存在的情况下-----对于excel而言肯定不会超过了,因为excel文件的最大行为65536-----可以全选数据COPY ,然后用PLSQL Developer工具。
1 在PLSQL Developer的sql window里输入select * from test for update;
2 按F8执行;
3 打开锁, 再按一下加号. 鼠标点到第一列的列头,使全列成选中状态,然后粘贴,最后COMMIT提交即可。
五、补充在Linux下使用 sqlldr 的注意事项
在执行 sqlldr 前,需要进行以下步骤
- 设置 ORACLE_HOME 环境变量,如 export ORACLE_HOME=/usr/lib/oracle/xe/app/oracle/product/10.2.0/server
- 设置ORACLE编码格式,将本地字符集和ORACLE字符集设置为一致,如export NLS_LANG="SIMPLIFIED CHINESE_CHINA.AL32UTF8"
- 将csv文件转码成相应的编码
然后再使用 sqlldr 进行数据导入
posted on 2010-11-07 15:42
哈哈的日子 阅读(4133)
评论(0) 编辑 收藏