paulwong

ANDROID APP 与 WEB APP的比较

ANDROID APP 与 WEB APP有相似之处，都是需要在容器内运行，都可以对事件进行响应。

WEB APP的核心组件是SERVLET，这是对游览器事件进行响应的一个类，事件有GET/POST等事件，不同的URL对应不同的SERVLET。

如果要输出不同的内容，则输出不同的HTML即可。
WEB APP的配置文件是WEB.XML，当容器启动时，会从这读取有多少个SERVLET。当浏览器发过来不同的URL请求时，会从中选择相应的SERVLET执行。

ANDROID APP的核心组件是ACTIVITY，这是一个对系统事件进行响应的一个类，事件有启动事件，菜单点击事件等，点击不同的地方对应不同的ACTIVITY。

如果要输出不同的内容，则输出不同的VIEW即可。
ANDROID APP的配置文件是MAINFRE.XML，当应用被部署到系统时，系统会从这读取有多少个ACTIVITY。当不同的事件发生时，系统会会从中选择相应的ACTIVITY执行。

posted @ 2013-05-26 00:59 paulwong 阅读(375) | 评论 (0) | 编辑收藏

Architecture Representation

The architecture representation will basically adopt the 4 + 1 View Model as

recommended, to organize the architectural description from different perspectives, each

of which addresses a specific set of concerns:

• Requirement View – describes the software requirements, functional and

non-functional, illustrated by significant use cases and scenarios.

• Logical View – describes the object model of the design, the system

decomposition into layers and subsystems, and the dependencies between them.

• Process View – describes the concurrency and synchronization aspects of the

design.

• Implementation View – describes the software’s static organization in the

development environment.

• Deployment View – describes the mapping of the software onto hardware.

• Data View – describes the database design for the software.

It allows various stakeholders to find what they need in the software architecture. System

engineers can approach it from the logical view, process view and deployment view. DBA

can approach it from the data view. Project managers and software configuration

managers can approach it from the development view.

Demo:

CUHK RFID - White Paper

Middleware Quick Start Guide

Tag Capturer Quick Start Guide

Middleware System Design Document

Tag Capturer System Design Document

Middleware Test Cases

Middleware Test Plan

Middleware Source Code

posted @ 2013-05-21 11:02 paulwong 阅读(216) | 评论 (0) | 编辑收藏

MINA资源

socket 通信
http://yaojialing.iteye.com/category/115609

使用 Apache MINA 2 开发网络应用
http://www.ibm.com/developerworks/cn/java/j-lo-mina2/

直接操作mina的IoBuffer流
http://autumnice.blog.163.com/blog/static/555200201011493410310/

pache mina 学习（十一）-----状态机（stateMachine）
http://cages.iteye.com/blog/1530849

运用 Apache MINA 2 开发网络运用 [多图]
http://www.lj8lj8.com/chengxukaifa/Java/338853_13.html

posted @ 2013-05-14 17:41 paulwong 阅读(321) | 评论 (0) | 编辑收藏

数据导出：

1 将数据库TEST完全导出,用户名system 密码manager 导出到D:\daochu.dmp中

exp system/manager@TEST file=d:\daochu.dmp full=y

2 将数据库中system用户与sys用户的表导出

exp system/manager@TEST file=d:\daochu.dmp owner=(system,sys)

3 将数据库中的表table1 、table2导出

exp system/manager@TEST file=d:\daochu.dmp tables=(table1,table2)

4 将数据库中的表table1中的字段filed1以"00"打头的数据导出

exp system/manager@TEST file=d:\daochu.dmp tables=(table1)query=\" where filed1 like '00%'\"

上面是常用的导出，对于压缩我不太在意，用winzip把dmp文件可以很好的压缩。

不过在上面命令后面加上 compress=y 就可以了

数据的导入

1 将D:\daochu.dmp 中的数据导入 TEST数据库中。

imp system/manager@TEST file=d:\daochu.dmp

上面可能有点问题，因为有的表已经存在，然后它就报错，对该表就不进行导入。

在后面加上 ignore=y 就可以了。

2 将d:\daochu.dmp中的表table1 导入

imp system/manager@TEST file=d:\daochu.dmp tables=(table1)

基本上上面的导入导出够用了。不少情况我是将表彻底删除，然后导入。

注意：

你要有足够的权限，权限不够它会提示你。

数据库时可以连上的。可以用tnsping TEST 来获得数据库TEST能否连上

附录一：
给用户增加导入数据权限的操作
第一,启动sql*puls
第二，以system/manager登陆
第三，create user 用户名 IDENTIFIED BY 密码（如果已经创建过用户，这步可以省略）
第四，GRANT CREATE USER,DROP USER,ALTER USER ,CREATE ANY VIEW ,
DROP ANY VIEW,EXP_FULL_DATABASE,IMP_FULL_DATABASE,
DBA,CONNECT,RESOURCE,CREATE SESSION TO 用户名字
第五, 运行-cmd-进入dmp文件所在的目录,
imp userid=system/manager full=y file=*.dmp
或者 imp userid=system/manager full=y file=filename.dmp

安装oracle9I
Szportdb\szportdb\szportdb
用sysdba 登录建立用户：szportdb 表空间可以自己设定，也可以Users
倒入数据库。

Imp szportdb/szportdb@szportdb full=y C:\szportdb.dmp ignore=

posted @ 2013-05-12 15:07 paulwong 阅读(1799) | 评论 (0) | 编辑收藏

基于Apache Mina实现的TCP长连接和短连接实例

1、前言

Apache MINA是Apache组织的一个优秀的项目。MINA是Multipurpose Infrastructure for NetworkApplications的缩写。它是一个网络应用程序框架，用来帮助用户非常方便地开发高性能和高可靠性的网络应用程序。在本文中介绍了如何通过Apache Mina2.0来实现TCP协议长连接和短连接应用。

2、系统介绍

2.1系统框架

整个系统由两个服务端程序和两个客户端程序组成。分别实现TCP长连接和短连接通信。

系统业务逻辑是一个客户端与服务端建立长连接，一个客户端与服务端建立短连接。数据从短连接客户端经过服务端发送到长连接客户端，并从长连接客户端接收响应数据。当收到响应数据后断开连接。

系统架构图如下：

2.2处理流程

系统处理流程如下：

1）启动服务端程序，监听8001和8002端口。

2）长连接客户端向服务端8002端口建立连接，服务端将连接对象保存到共享内存中。由于采用长连接方式，连接对象是唯一的。

3）短连接客户端向服务端8001端口建立连接。建立连接后创建一个连接对象。

4）短连接客户端连接成功后发送数据。服务端接收到数据后从共享内存中得到长连接方式的连接对象，使用此对象向长连接客户端发送数据。发送前将短连接对象设为长连接对象的属性值。

5）长连接客户端接收到数据后返回响应数据。服务端从长连接对象的属性中取得短连接对象，通过此对象将响应数据发送给短连接客户端。

6）短连接客户端收到响应数据后，关闭连接。

3、服务端程序

3.1长连接服务端

服务启动

public class MinaLongConnServer {

private static final int PORT = 8002;

public void start()throws IOException{

IoAcceptor acceptor = new NioSocketAcceptor();

acceptor.getFilterChain().addLast("logger", new LoggingFilter());

acceptor.getFilterChain().addLast("codec", newProtocolCodecFilter(new TextLineCodecFactory(Charset.forName("UTF-8"))));

acceptor.setHandler(new MinaLongConnServerHandler());

acceptor.getSessionConfig().setReadBufferSize(2048);

acceptor.bind(new InetSocketAddress(PORT));

System.out.println("Listeningon port " + PORT);

}

}

//消息处理

public class MinaLongConnServerHandler extends IoHandlerAdapter {

private final Logger logger = (Logger) LoggerFactory.getLogger(getClass());

@Override

public void sessionOpened(IoSession session) {

InetSocketAddress remoteAddress = (InetSocketAddress)session.getRemoteAddress();

String clientIp = remoteAddress.getAddress().getHostAddress();

logger.info("LongConnect Server opened Session ID ="+String.valueOf(session.getId()));

logger.info("接收来自客户端 :" + clientIp + "的连接.");

Initialization init = Initialization.getInstance();

HashMap<String, IoSession> clientMap =init.getClientMap();

clientMap.put(clientIp, session);

}

@Override

public void messageReceived(IoSession session, Object message) {

logger.info("Messagereceived in the long connect server..");

String expression = message.toString();

logger.info("Message is:" + expression);

IoSession shortConnSession =(IoSession) session.getAttribute("shortConnSession");

logger.info("ShortConnect Server Session ID ="+String.valueOf(shortConnSession.getId()));

shortConnSession.write(expression);

}

@Override

public void sessionIdle(IoSession session, IdleStatus status) {

logger.info("Disconnectingthe idle.");

// disconnect an idle client

session.close(true);

}

@Override

public void exceptionCaught(IoSession session, Throwable cause) {

// close the connection onexceptional situation

logger.warn(cause.getMessage(), cause);

session.close(true);

}

}

3.2短连接服务端

服务启动

public class MinaShortConnServer {

private static final int PORT = 8001;

public void start()throws IOException{

IoAcceptor acceptor = new NioSocketAcceptor();

acceptor.getFilterChain().addLast("logger", new LoggingFilter());

acceptor.getFilterChain().addLast("codec", newProtocolCodecFilter(new TextLineCodecFactory(Charset.forName("UTF-8"))));

acceptor.setHandler(new MinaShortConnServerHandler());

acceptor.getSessionConfig().setReadBufferSize(2048);

acceptor.getSessionConfig().setIdleTime(IdleStatus.BOTH_IDLE, 3);

acceptor.bind(new InetSocketAddress(PORT));

System.out.println("Listeningon port " + PORT);

}

}

消息处理

public class MinaShortConnServerHandler extends IoHandlerAdapter {

private final Logger logger = (Logger) LoggerFactory.getLogger(getClass());

@Override

public void sessionOpened(IoSession session) {

InetSocketAddress remoteAddress = (InetSocketAddress)session.getRemoteAddress();

logger.info(remoteAddress.getAddress().getHostAddress());

logger.info(String.valueOf(session.getId()));

}

@Override

public void messageReceived(IoSession session, Object message) {

logger.info("Messagereceived in the short connect server

");

String expression = message.toString();

Initialization init = Initialization.getInstance();

HashMap<String, IoSession> clientMap =init.getClientMap();

if (clientMap == null || clientMap.size() == 0) {

session.write("error");

} else {

IoSession longConnSession = null;

Iterator<String> iterator =clientMap.keySet().iterator();

String key = "";

while (iterator.hasNext()) {

key = iterator.next();

longConnSession = clientMap.get(key);

}

logger.info("ShortConnect Server Session ID :"+String.valueOf(session.getId()));

logger.info("LongConnect Server Session ID :"+String.valueOf(longConnSession.getId()));

longConnSession.setAttribute("shortConnSession",session);

longConnSession.write(expression);

}

}

@Override

public void sessionIdle(IoSession session, IdleStatus status) {

logger.info("Disconnectingthe idle.");

// disconnect an idle client

session.close(true);

}

@Override

public void exceptionCaught(IoSession session, Throwable cause) {

// close the connection onexceptional situation

logger.warn(cause.getMessage(), cause);

session.close(true);

}

}

4、客户端程序

4.1长连接客户端

使用java.net.Socket来实现向服务端建立连接。Socket建立后一直保持连接，从服务端接收到数据包后直接将原文返回。

public class TcpKeepAliveClient {

private String ip;

private int port;

private static Socket socket = null;

private static int timeout = 50 * 1000;

public TcpKeepAliveClient(String ip, int port) {

this.ip = ip;

this.port = port;

}

public void receiveAndSend() throws IOException {

InputStream input = null;

OutputStream output = null;

try {

if (socket == null || socket.isClosed() || !socket.isConnected()) {

socket = new Socket();

InetSocketAddress addr = new InetSocketAddress(ip, port);

socket.connect(addr, timeout);

socket.setSoTimeout(timeout);

System.out.println("TcpKeepAliveClientnew ");

}

input = socket.getInputStream();

output = socket.getOutputStream();

// read body

byte[] receiveBytes = {};// 收到的包字节数组

while (true) {

if (input.available() > 0) {

receiveBytes = new byte[input.available()];

input.read(receiveBytes);

// send

System.out.println("TcpKeepAliveClientsend date :" + new String(receiveBytes));

output.write(receiveBytes, 0, receiveBytes.length);

output.flush();

}

}

} catch (Exception e) {

e.printStackTrace();

System.out.println("TcpClientnew socket error");

}

}

public static void main(String[] args) throws Exception {

TcpKeepAliveClient client = new TcpKeepAliveClient("127.0.0.1", 8002);

client.receiveAndSend();

}

}

4.2短连接客户端

服务启动

public class MinaShortClient {

private static final int PORT = 8001;

public static void main(String[] args) throws IOException,InterruptedException {

IoConnector connector = new NioSocketConnector();

connector.getSessionConfig().setReadBufferSize(2048);

connector.getFilterChain().addLast("logger", new LoggingFilter());

connector.getFilterChain().addLast("codec", newProtocolCodecFilter(new TextLineCodecFactory(Charset.forName("UTF-8"))));

connector.setHandler(new MinaShortClientHandler());

for (int i = 1; i <= 10; i++) {

ConnectFuture future = connector.connect(new InetSocketAddress("127.0.0.1", PORT));

future.awaitUninterruptibly();

IoSession session =future.getSession();

session.write(i);

session.getCloseFuture().awaitUninterruptibly();

System.out.println("result=" + session.getAttribute("result"));

}

connector.dispose();

}

}

消息处理

public class MinaShortClientHandler extends IoHandlerAdapter{

private final Logger logger = (Logger) LoggerFactory.getLogger(getClass());

public MinaShortClientHandler() {

}

@Override

public void sessionOpened(IoSession session) {

}

@Override

public void messageReceived(IoSession session, Object message) {

logger.info("Messagereceived in the client..");

logger.info("Message is:" + message.toString());

session.setAttribute("result", message.toString());

session.close(true);

}

@Override

public void exceptionCaught(IoSession session, Throwable cause) {

session.close(true);

}

}

5、总结

通过本文中的例子，Apache Mina在服务端可实现TCP协议长连接和短连接。在客户端只实现了短连接模式，长连接模式也是可以实现的（在本文中还是采用传统的java Socket方式）。两个服务端之间通过共享内存的方式来传递连接对象也许有更好的实现方式。

posted @ 2013-05-11 21:56 paulwong 阅读(560) | 评论 (0) | 编辑收藏

使用 Apache MINA 开发高性能网络应用程序[转]

本文将通过一个简单的问候程序 HelloServer 来介绍 MINA 的基础架构的同时演示如何使用 MINA 开发网络应用程序。
Apache MINA(Multipurpose Infrastructure for Network Applications) 是 Apache 组织一个较新的项目，它为开发高性能和高可用性的网络应用程序提供了非常便利的框架。当前发行的 MINA 版本支持基于 Java NIO 技术的 TCP/UDP 应用程序开发、串口通讯程序（只在最新的预览版中提供），MINA 所支持的功能也在进一步的扩展中。

目前正在使用 MINA 的软件包括有：Apache Directory Project、AsyncWeb、AMQP（Advanced Message Queuing Protocol）、RED5 Server（Macromedia Flash Media RTMP）、ObjectRADIUS、Openfire 等等。

本文将通过一个简单的问候程序 HelloServer 来介绍 MINA 的基础架构的同时演示如何使用MINA 开发网络应用程序。

环境准备

首先到官方网站下载最新的 MINA 版本，地址是：http://mina.apache.org/downloads.html。下载之前先介绍一下 MINA 的两个版本：1.0.x 适合运行环境为 JDK1.4，1.1.x 适合 JDK1.5 的版本，两者的编译环境都需要 JDK1.5。JDK1.5 已经是非常普遍了，本文中使用 1.1.5 版本的 MINA，编译和运行所需的文件是 mina-core-1.1.5.jar。
下载 MINA 的依赖包 slf4j。MINA 使用此项目作为日志信息的输出，而 MINA 本身并不附带此项目包，请到http://www.slf4j.org/download.html 地址下载 slf4j 包，slf4j 项目解压后有很多的文件，本例中只需要其中的 slf4j-api-1.4.3.jar 和 slf4j-simple-1.4.3.jar 这两个 jar 文件。如果没有这两个文件就会导致启动例子程序的时候报 org/slf4j/LoggerFactory 类没找到的错误。
当然要求机器上必须装有 1.5 或者更新版本的 JDK。
最好你应该选择一个顺手的 Java 开发环境例如 Eclipse 或者 NetBeans 之类的，可以更方便的编码和调试，虽然我们的最低要求只是一个简单的文本编辑器而已。

编写代码并执行

编写代码 HelloServer.java 如下

package demo.mina.echo;

import java.io.IOException;
import java.net.InetSocketAddress;

import org.apache.mina.common.*;
import org.apache.mina.transport.socket.nio.*;
import org.apache.mina.filter.codec.ProtocolCodecFilter;
import org.apache.mina.filter.codec.textline.TextLineCodecFactory;

/**
* HelloServer演示程序
* @author liudong (
                    http://www.dlog.cn/javayou
                )
*/
public class HelloServer {

    private static final int PORT = 8080;
/**
* @param args
* @throws IOException
*/
public static void main(String[] args) throws IOException {
        IoAcceptor acceptor = new SocketAcceptor();
        IoAcceptorConfig config = new SocketAcceptorConfig();
        DefaultIoFilterChainBuilder chain = config.getFilterChain();
        //使用字符串编码
        chain.addLast("codec",
new ProtocolCodecFilter(new TextLineCodecFactory()));
        //启动HelloServer
        acceptor.bind(new InetSocketAddress(PORT), new HelloHandler(), config);
        System.out
.println("HelloServer started on port " +
PORT);
    }
}

/**
* HelloServer的处理逻辑
* @author liudong
*/
class HelloHandler extends IoHandlerAdapter {
/**
* 当有异常发生时触发
*/
@Override
    public void exceptionCaught(IoSession ssn, Throwable cause) {
        cause.printStackTrace();
        ssn.close();
    }

/**
* 有新连接时触发
*/
@Override
public void sessionOpened(IoSession ssn) throws Exception {
    System.out.println("session open for " + ssn.getRemoteAddress());
    }

/**
* 连接被关闭时触发
*/
@Override
public void sessionClosed(IoSession ssn) throws Exception {
    System.out.println("session closed from " + ssn.getRemoteAddress());
    }

/**
* 收到来自客户端的消息
*/
public void messageReceived(IoSession ssn, Object msg) throws Exception {
    String ip = ssn.getRemoteAddress().toString();
System.out.println("===> Message From " + ip +" : " + msg);
    ssn.write("Hello " + msg);
    }
}

编译执行
先不用试着去读懂每一行代码的具体意思，用你顺手的编译器编译 HelloServer.java，如果报错请确认是否已将前面提到的三个 jar 文件添加至类路径中。如果一切顺利接着就可以启动HelloServer 程序，启动后提示：HelloServer started on port 8080 表示启动成功，如果启动失败，问题无外乎是类没找到或者端口占用。如果端口被占用的话，换一个罗，修改 PORT 常量值后再次编译并启动。

测试服务器
打开命令行窗口，输入 telnet localhost 8080 后，输入您的英文名或者其他一些乱七八糟的字符后回车再去看看刚启动的服务程序有何反应。我的反应如下：

HelloServer started on port 8080
session open for /127.0.0.1:3023
===> Message From /127.0.0.1:3023 :hello
===> Message From /127.0.0.1:3023 :hello
===> Message From /127.0.0.1:3023 :liudong
===> Message From /127.0.0.1:3023 :Winter Lau

好了，一切正常，恭喜你的第一个使用 MINA 开发的网络程序已经成功运行了。

MINA 基本类的描述

在介绍架构之前先认识几个接口：

IoAccepter 相当于网络应用程序中的服务器端

IoConnector 相当于客户端

IoSession 当前客户端到服务器端的一个连接实例

IoHandler 业务处理逻辑

IoFilter 过滤器用于悬接通讯层接口与业务层接口

MINA 的基础架构

下图是 MINA 的架构图，

图 1：MINA 的架构图

在图中的模块链中，IoService 便是应用程序的入口，相当于我们前面代码中的 IoAccepter，IoAccepter 便是 IoService 的一个扩展接口。IoService 接口可以用来添加多个 IoFilter，这些 IoFilter 符合责任链模式并由 IoProcessor 线程负责调用。而 IoAccepter 在 ioService 接口的基础上还提供绑定某个通讯端口以及取消绑定的接口。在上面的例子中，我们是这样使用 IoAccepter 的：

IoAcceptor acceptor = new SocketAcceptor();

相当于我们使用了 Socket 通讯方式作为服务的接入，当前版本的 MINA 还提供了除 SocketAccepter 外的基于数据报文通讯的 DatagramAccepter 以及基于管道通讯的 VmPipeAccepter。另外还包括串口通讯接入方式，目前基于串口通讯的接入方式已经在最新测试版的 MINA 中提供。你也可以自行实现 IoService 接口来使用自己的通讯方式。

而在上图中最右端也就是 IoHandler，这便是业务处理模块。相当于前面例子中的 HelloHandler 类。在业务处理类中不需要去关心实际的通讯细节，只管处理客户端传输过来的信息即可。编写 Handler 类就是使用 MINA 开发网络应用程序的重心所在，相当于 MINA 已经帮你处理了所有的通讯方面的细节问题。为了简化 Handler 类，MINA 提供了 IoHandlerAdapter 类，此类仅仅是实现了 IoHandler 接口，但并不做任何处理。

一个 IoHandler 接口中具有如下一些方法（摘自 MINA 的 API 文档）：

void exceptionCaught(IoSession session, Throwable cause)
当接口中其他方法抛出异常未被捕获时触发此方法
void messageReceived(IoSession session, Object message)
当接收到客户端的请求信息后触发此方法.
void messageSent(IoSession session, Object message)
当信息已经传送给客户端后触发此方法.
void sessionClosed(IoSession session)
当连接被关闭时触发，例如客户端程序意外退出等等.
void sessionCreated(IoSession session)
当一个新客户端连接后触发此方法.
void sessionIdle(IoSession session, IdleStatus status)
当连接空闲时触发此方法.
void sessionOpened(IoSession session)
当连接后打开时触发此方法，一般此方法与 sessionCreated 会被同时触发

前面我们提到 IoService 是负责底层通讯接入，而 IoHandler 是负责业务处理的。那么 MINA 架构图中的 IoFilter 作何用途呢？答案是你想作何用途都可以。但是有一个用途却是必须的，那就是作为 IoService 和 IoHandler 之间的桥梁。IoHandler 接口中最重要的一个方法是 messageReceived，这个方法的第二个参数是一个 Object 型的消息，总所周知，Object 是所有 Java 对象的基础，那到底谁来决定这个消息到底是什么类型呢？答案也就在这个 IoFilter 中。在前面使用的例子中，我们添加了一个 IoFilter 是 new ProtocolCodecFilter(new TextLineCodecFactory())，这个过滤器的作用是将来自客户端输入的信息转换成一行行的文本后传递给 IoHandler，因此我们可以在 messageReceived 中直接将 msg 对象强制转换成 String 对象。

而如果我们不提供任何过滤器的话，那么在 messageReceived 方法中的第二个参数类型就是一个 byte 的缓冲区，对应的类是 org.apache.mina.common.ByteBuffer。虽然你也可以将解析客户端信息放在 IoHandler 中来做，但这并不是推荐的做法，使原来清晰的模型又模糊起来，变得 IoHandler 不只是业务处理，还得充当协议解析的任务。

MINA自身带有一些常用的过滤器，例如LoggingFilter（日志记录）、BlackListFilter（黑名单过滤）、CompressionFilter（压缩）、SSLFilter（SSL加密）等。

其他

MINA 不仅仅是用来开发网络服务器端应用程序，它一样可以使用 IoConnector 来连接到各种各样的网络服务程序。

通过本文中 HelloServer 这个例子，我们在惊叹 MINA 可以带来多么大便利的同时，还不得不为其卓越的性能而骄傲，据称使用MINA开发服务器程序的性能已经逼近使用 C/C++ 语言开发的网络服务。作为 MINA 的入门文章，性能问题不在本文讨论范围内。

另外在 MINA 压缩包中附带有不少比 HelloServer 要好得多的例子，通过这些例子可以进一步的了解并掌握 MINA。

参考资料

http://mina.apache.org MINA 官方网站

http://mina.apache.org/features.html 您可以在这里查看关于 MINA 的更多特性

http://mina.apache.org/testimonials.html 看看别人是如何评价 MINA 的 http://asyncweb.safehaus.org/使用 MINA 开发的高性能 WEB 服务器

posted @ 2013-05-11 21:41 paulwong 阅读(308) | 评论 (0) | 编辑收藏

使用Sqoop实现HDFS与Mysql互转

简介
Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导入到Hadoop的HDFS中，也可以将HDFS的数据导入到关系型数据库中。

http://sqoop.apache.org/

环境
当调试过程出现IncompatibleClassChangeError一般都是版本兼容问题。

为了保证hadoop和sqoop版本的兼容性，使用Cloudera，

Cloudera简介：

Cloudera为了让Hadoop的配置标准化，可以帮助企业安装，配置，运行hadoop以达到大规模企业数据的处理和分析。

http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDHTarballs/3.25.2013/CDH4-Downloadable-Tarballs/CDH4-Downloadable-Tarballs.html

下载安装hadoop-0.20.2-cdh3u6，sqoop-1.3.0-cdh3u6。

安装
安装比较简单，直接解压即可

唯一需要做的就是将mysql的jdbc适配包mysql-connector-java-5.0.7-bin.jar copy到$SQOOP_HOME/lib下。

配置好环境变量：/etc/profile

export SQOOP_HOME=/home/hadoop/sqoop-1.3.0-cdh3u6/

export PATH=$SQOOP_HOME/bin:$PATH

MYSQL转HDFS-示例
./sqoop import --connect jdbc:mysql://10.8.210.166:3306/recsys --username root --password root --table shop -m 1 --target-dir /user/recsys/input/shop/$today

HDFS转MYSQ-示例
./sqoop export --connect jdbc:mysql://10.8.210.166:3306/recsys --username root --password root --table shopassoc --fields-terminated-by ',' --export-dir /user/recsys/output/shop/$today

示例参数说明
(其他参数我未使用，故不作解释，未使用，就没有发言权，详见命令help)

参数类型

参数名

解释

公共

connect

Jdbc-url

公共

username

---

公共

password

---

公共

table

表名

Import

target-dir

制定输出hdfs目录，默认输出到/user/$loginName/

export

fields-terminated-by

Hdfs文件中的字段分割符，默认是“\t”

export

export-dir

hdfs文件的路径

posted @ 2013-05-11 21:27 paulwong 阅读(462) | 评论 (0) | 编辑收藏

全方位的技术服务及相关技术解决方案（纯java解决方案）

http://www.iteye.com/topic/1128561 @import url(http://www.blogjava.net/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);

posted @ 2013-05-11 00:17 paulwong 阅读(517) | 评论 (0) | 编辑收藏

让spring-data-jpa解放你的DAO

摘要: 最近项目用Spring-data-jpa，确实很方便。如果你也曾经被重复无聊的dao代码雷到的话，就可以考虑将ORM framework换成spring-data-jpa了。只要继承CrudRepository或者PagingAndSortingRepository，dao层基本上就只剩下定义接口方法这么一件事情了，连实现都不用写，因为默认实现SimpleJpaRepository已经帮你实现了... 阅读全文

posted @ 2013-05-09 14:16 paulwong 阅读(5573) | 评论 (1) | 编辑收藏

mysql分表，分区的区别和联系

一，什么是mysql分表，分区

什么是分表，从表面意思上看呢，就是把一张表分成N多个小表，具体请看mysql分表的3种方法

什么是分区，分区呢就是把一张表的数据分成N多个区块，这些区块可以在同一个磁盘上，也可以在不同的磁盘上，具体请参考mysql分区功能详细介绍，以及实例

二，mysql分表和分区有什么区别呢

1，实现方式上

a），mysql的分表是真正的分表，一张表分成很多表后，每一个小表都是完正的一张表，都对应三个文件，一个.MYD数据文件，.MYI索引文件，.frm表结构文件。

[root@BlackGhost test]# ls |grep user
alluser.MRG
alluser.frm
user1.MYD
user1.MYI
user1.frm
user2.MYD
user2.MYI
user2.frm

[root@BlackGhost test]# ls |grep user alluser.MRG alluser.frm user1.MYD user1.MYI user1.frm user2.MYD user2.MYI user2.frm

简单说明一下，上面的分表呢是利用了merge存储引擎（分表的一种），alluser是总表，下面有二个分表，user1，user2。他们二个都是独立的表，取数据的时候，我们可以通过总表来取。这里总表是没有.MYD,.MYI这二个文件的，也就是说，总表他不是一张表，没有数据，数据都放在分表里面。我们来看看.MRG到底是什么东西

[root@BlackGhost test]# cat alluser.MRG |more
user1
user2
#INSERT_METHOD=LAST

[root@BlackGhost test]# cat alluser.MRG |more user1 user2 #INSERT_METHOD=LAST

从上面我们可以看出，alluser.MRG里面就存了一些分表的关系，以及插入数据的方式。可以把总表理解成一个外壳，或者是联接池。

b），分区不一样，一张大表进行分区后，他还是一张表，不会变成二张表，但是他存放数据的区块变多了。

[root@BlackGhost test]# ls |grep aa
aa#P#p1.MYD
aa#P#p1.MYI
aa#P#p3.MYD
aa#P#p3.MYI
aa.frm
aa.par

[root@BlackGhost test]# ls |grep aa aa#P#p1.MYD aa#P#p1.MYI aa#P#p3.MYD aa#P#p3.MYI aa.frm aa.par

从上面我们可以看出，aa这张表，分为二个区，p1和p3，本来是三个区，被我删了一个区。我们都知道一张表对应三个文件.MYD,.MYI,.frm。分区呢根据一定的规则把数据文件和索引文件进行了分割，还多出了一个.par文件，打开.par文件后你可以看出他记录了，这张表的分区信息，根分表中的.MRG有点像。分区后，还是一张，而不是多张表。

2，数据处理上

a），分表后，数据都是存放在分表里，总表只是一个外壳，存取数据发生在一个一个的分表里面。看下面的例子：

select * from alluser where id='12'表面上看，是对表alluser进行操作的，其实不是的。是对alluser里面的分表进行了操作。

b），分区呢，不存在分表的概念，分区只不过把存放数据的文件分成了许多小块，分区后的表呢，还是一张表。数据处理还是由自己来完成。

3，提高性能上

a），分表后，单表的并发能力提高了，磁盘I/O性能也提高了。并发能力为什么提高了呢，因为查寻一次所花的时间变短了，如果出现高并发的话，总表可以根据不同的查询，将并发压力分到不同的小表里面。磁盘I/O性能怎么搞高了呢，本来一个非常大的.MYD文件现在也分摊到各个小表的.MYD中去了。

b），mysql提出了分区的概念，我觉得就想突破磁盘I/O瓶颈，想提高磁盘的读写能力，来增加mysql性能。
在这一点上，分区和分表的测重点不同，分表重点是存取数据时，如何提高mysql并发能力上；而分区呢，如何突破磁盘的读写能力，从而达到提高mysql性能的目的。

4），实现的难易度上

a），分表的方法有很多，用merge来分表，是最简单的一种方式。这种方式根分区难易度差不多，并且对程序代码来说可以做到透明的。如果是用其他分表方式就比分区麻烦了。

b），分区实现是比较简单的，建立分区表，根建平常的表没什么区别，并且对开代码端来说是透明的。

三，mysql分表和分区有什么联系呢

1，都能提高mysql的性高，在高并发状态下都有一个良好的表面。

2，分表和分区不矛盾，可以相互配合的，对于那些大访问量，并且表数据比较多的表，我们可以采取分表和分区结合的方式（如果merge这种分表方式，不能和分区配合的话，可以用其他的分表试），访问量不大，但是表数据很多的表，我们可以采取分区的方式等。

posted @ 2013-05-07 09:19 paulwong 阅读(457) | 评论 (0) | 编辑收藏

仅列出标题

My Links

Blog Stats

常用链接

留言簿(67)

随笔分类(1392)

随笔档案(1150)

文章分类(7)

文章档案(10)

相册

收藏夹(2)

AI

Develop

E-BOOK

Other

养生

微服务

搜索

最新评论

阅读排行榜

评论排行榜

60天内阅读排行