﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>BlogJava-OpenHandX 2数据服务为中心的企业架构(java)-随笔分类-OpenHandX产品</title><link>http://www.blogjava.net/pengminghua/category/41518.html</link><description /><language>zh-cn</language><lastBuildDate>Sun, 08 Jun 2014 17:03:42 GMT</lastBuildDate><pubDate>Sun, 08 Jun 2014 17:03:42 GMT</pubDate><ttl>60</ttl><item><title>OpenHandX-River 1.0</title><link>http://www.blogjava.net/pengminghua/archive/2012/11/12/ESB.html</link><dc:creator>彭明华</dc:creator><author>彭明华</author><pubDate>Mon, 12 Nov 2012 13:24:00 GMT</pubDate><guid>http://www.blogjava.net/pengminghua/archive/2012/11/12/ESB.html</guid><wfw:comment>http://www.blogjava.net/pengminghua/comments/391231.html</wfw:comment><comments>http://www.blogjava.net/pengminghua/archive/2012/11/12/ESB.html#Feedback</comments><slash:comments>2</slash:comments><wfw:commentRss>http://www.blogjava.net/pengminghua/comments/commentRss/391231.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/pengminghua/services/trackbacks/391231.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要: OpenHandx-River是一个OpenHandX-Unreal Web Service标准的ESB（Enterprise Service Bus）企业服务总线产品。ESB本身是构筑企业系统的必要元素，改变了传统的软件架构，可以提供比传统中间件产品更为廉价的解决方案，同时它还可以消除不同应用之间的技术差异，让不同的应用服务器协调运作，实现了不同服务之间的通信与整合。OpenHandx-River提供了一种开放的、基于Unreal的 OpenService，通过简单的服务注册，来完成粗粒度应用（服务）和其他组件之间的互操作，够满足大型异构企业环境的集成需求。OpenHandx-River是将所有基于OpenHandX-Unreal开发项目的Web Service（或相同标准的Web Service）集中起来，统一包装、统一管理、统一入口构成企业服务总线，是打造数据服务为中心企业架构的重要组件。River提供了代理、点对点两种ESB服务模式，同时满足安全和高速访问的需求。在消息传递上River具备发送消息的功能，解决系统间异步的消息和数据传递。此外OpenHandx-River也是Op&nbsp;&nbsp;<a href='http://www.blogjava.net/pengminghua/archive/2012/11/12/ESB.html'>阅读全文</a><img src ="http://www.blogjava.net/pengminghua/aggbug/391231.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/pengminghua/" target="_blank">彭明华</a> 2012-11-12 21:24 <a href="http://www.blogjava.net/pengminghua/archive/2012/11/12/ESB.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>Open HandX 决策分析产品（由于该产品需要很多准备工作，暂停）</title><link>http://www.blogjava.net/pengminghua/archive/2009/09/02/293613.html</link><dc:creator>彭明华</dc:creator><author>彭明华</author><pubDate>Wed, 02 Sep 2009 08:26:00 GMT</pubDate><guid>http://www.blogjava.net/pengminghua/archive/2009/09/02/293613.html</guid><wfw:comment>http://www.blogjava.net/pengminghua/comments/293613.html</wfw:comment><comments>http://www.blogjava.net/pengminghua/archive/2009/09/02/293613.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.blogjava.net/pengminghua/comments/commentRss/293613.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/pengminghua/services/trackbacks/293613.html</trackback:ping><description><![CDATA[<p>&nbsp;&nbsp; <span style="font-family: 宋体">前言</span></p>
<p><span style="font-family: 宋体">也许您用过</span>cognos<span style="font-family: 宋体">等数据挖掘工具，但我很遗憾的告诉您那只是一个功能强大的自定义报表展现工具。</span></p>
<p><span style="font-family: 宋体">数据挖掘（</span>DM<span style="font-family: 宋体">，</span>Data Mining<span style="font-family: 宋体">）就是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的，但又是潜在的有用信息和知识的过程。还有很多和这一术语相近的术语，如从数据库中发现知识（</span>KDD<span style="font-family: 宋体">）、数据分析、知识抽取、商业智能、决策分析等。</span> <span style="font-family: 宋体">这里最重要的不仅是面向特定数据库的简单检索查询调用，而且要对这些数据进行微观或宏观的统计、分析、综合和推理，企图发现事件间的相互关联，甚至利用已有的数据对未来的活动进行预测。</span></p>
<h1><span style="font-family: 宋体">数据挖掘的数据来源</span></h1>
<p>1<span style="font-family: 宋体">、关系数据库：日常运行的业务系统拥有大量的数据库</span></p>
<p>2<span style="font-family: 宋体">、数据仓库</span></p>
<p>3<span style="font-family: 宋体">、事务数据库：把一个或几个事务数据库集中到一个只读的数据挖掘库</span></p>
<p>4<span style="font-family: 宋体">、高级数据库及高级数据库的应用：</span>CAD<span style="font-family: 宋体">空间数据库、文本数据库、空间数据库、多媒体数据库等</span></p>
<h1><span style="font-family: 宋体">数据挖掘的体系结构与运行过程</span></h1>
<p>
<table style="width: 460.5pt" cellspacing="0" cellpadding="0" width="614" border="0">
    <tbody>
        <tr style="height: 31.5pt">
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1.5pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1.5pt solid; width: 37.45pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 31.5pt" valign="top" width="50">
            <p><span style="font-family: 宋体">代</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1.5pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.25pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 31.5pt" valign="top" width="88">
            <p><span style="font-family: 宋体">特征</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1.5pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 31.5pt" valign="top" width="89">
            <p><span style="font-family: 宋体">数据挖掘算法</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1.5pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 91.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 31.5pt" valign="top" width="123">
            <p><span style="font-family: 宋体">集成</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1.5pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 90pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 31.5pt" valign="top" width="120">
            <p><span style="font-family: 宋体">分布计算模型</span></p>
            </td>
            <td style="border-right: black 1.5pt solid; padding-right: 0cm; border-top: black 1.5pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 108pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 31.5pt" valign="top" width="144">
            <p><span style="font-family: 宋体">数据模型</span></p>
            </td>
        </tr>
        <tr style="height: 38.25pt">
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1.5pt solid; width: 37.45pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="50">
            <p><span style="font-family: 宋体">第一代</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.25pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="88">
            <p><span style="font-family: 宋体">数据挖掘作为一个独立的应用</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="89">
            <p><span style="font-family: 宋体">支持一个或者多个算法</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 91.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="123">
            <p><span style="font-family: 宋体">独立的系统</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 90pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="120">
            <p><span style="font-family: 宋体">单个机器</span></p>
            </td>
            <td style="border-right: black 1.5pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 108pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="144">
            <p><span style="font-family: 宋体">向量数据</span></p>
            </td>
        </tr>
        <tr style="height: 49.5pt">
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1.5pt solid; width: 37.45pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 49.5pt" valign="top" width="50">
            <p><span style="font-family: 宋体">第二代</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.25pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 49.5pt" valign="top" width="88">
            <p><span style="font-family: 宋体">和数据库以及数据仓库集成</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 49.5pt" valign="top" width="89">
            <p><span style="font-family: 宋体">多个算法，能够挖掘一次不能放进内存的数据</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 91.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 49.5pt" valign="top" width="123">
            <p><span style="font-family: 宋体">数据管理系统，包括数据库和数据仓库</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 90pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 49.5pt" valign="top" width="120">
            <p><span style="font-family: 宋体">局部区域的计算机集群</span></p>
            </td>
            <td style="border-right: black 1.5pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 108pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 49.5pt" valign="top" width="144">
            <p><span style="font-family: 宋体">有些系统支持对象、文本和连续的媒体数据</span></p>
            </td>
        </tr>
        <tr style="height: 38.25pt">
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1.5pt solid; width: 37.45pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="50">
            <p><span style="font-family: 宋体">第三代</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.25pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="88">
            <p><span style="font-family: 宋体">和预言模型系统集成</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="89">
            <p><span style="font-family: 宋体">多个算法</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 91.9pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="123">
            <p><span style="font-family: 宋体">数据管理和预言模型系统</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 90pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="120">
            <p>Internet/Extranet<span style="font-family: 宋体">网络计算</span></p>
            </td>
            <td style="border-right: black 1.5pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 108pt; padding-top: 0cm; border-bottom: black 1pt solid; height: 38.25pt" valign="top" width="144">
            <p><span style="font-family: 宋体">支持半结构化数据和</span>Web<span style="font-family: 宋体">数据</span></p>
            </td>
        </tr>
        <tr style="height: 38.25pt">
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1.5pt solid; width: 37.45pt; padding-top: 0cm; border-bottom: black 1.5pt solid; height: 38.25pt" valign="top" width="50">
            <p><span style="font-family: 宋体">第四代</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.25pt; padding-top: 0cm; border-bottom: black 1.5pt solid; height: 38.25pt" valign="top" width="88">
            <p><span style="font-family: 宋体">和移动数据</span>/<span style="font-family: 宋体">各种计算数据联合</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 66.9pt; padding-top: 0cm; border-bottom: black 1.5pt solid; height: 38.25pt" valign="top" width="89">
            <p><span style="font-family: 宋体">多个算法</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 91.9pt; padding-top: 0cm; border-bottom: black 1.5pt solid; height: 38.25pt" valign="top" width="123">
            <p><span style="font-family: 宋体">数据管理、预言模型、移动系统</span></p>
            </td>
            <td style="border-right: black 1pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 90pt; padding-top: 0cm; border-bottom: black 1.5pt solid; height: 38.25pt" valign="top" width="120">
            <p><span style="font-family: 宋体">移动和各种计算设备</span></p>
            </td>
            <td style="border-right: black 1.5pt solid; padding-right: 0cm; border-top: black 1pt solid; padding-left: 0cm; padding-bottom: 0cm; border-left: black 1pt solid; width: 108pt; padding-top: 0cm; border-bottom: black 1.5pt solid; height: 38.25pt" valign="top" width="144">
            <p><span style="font-family: 宋体">普遍存在的计算模型</span></p>
            </td>
        </tr>
    </tbody>
</table>
</p>
<h1><span style="font-family: 宋体">数据挖掘的分类</span></h1>
<p>1<span style="font-family: 宋体">、分类分析：主要用于预测模型，通过数据库中的某些数据得到另外的数据为目标。分类算法通过判断数据记录的属性与已知训练数据中风险程度的关系给出预言结果</span></p>
<p>2<span style="font-family: 宋体">、聚类分析：聚类用于从数据集中找出相似的数据并组成不同的组。与前面的预测模型不同，聚类中没有明显的目标变量作为数据的属性存在。聚类算法通过检测数据判断&#8220;隐藏属性&#8221;</span></p>
<p>3<span style="font-family: 宋体">、关联规则：目的在于生成部分数据的概要，寻找数据子集间的关联关系或者一些数据与其数据之间的派生关系</span></p>
<p>4<span style="font-family: 宋体">、人工神经网络</span></p>
<p>5<span style="font-family: 宋体">、遗传算法</span></p>
<p>6<span style="font-family: 宋体">、模糊集和模糊逻辑</span></p>
<p>7<span style="font-family: 宋体">、可视化方法</span></p>
<h1><span style="font-family: 宋体">数据挖掘的步骤</span></h1>
<p>1<span style="font-family: 宋体">、问题定义：明确实际工作对数据挖掘的需求、通过对各种学习算法的对比而确定可用的学习算法</span></p>
<p>2<span style="font-family: 宋体">、数据收集和预处理：数据准备、数据集成、数据清洗、数据变换、数据简化</span></p>
<p>3<span style="font-family: 宋体">、数据挖掘算法执行：确定挖掘任务后，就要决定使用什么样的算法。选择实现算法有两个考虑因素：一是不同的数据有不同的特点，因此需要与之相关的算法来挖掘；二是用户或实际运行系统的要求</span></p>
<p>4<span style="font-family: 宋体">、结果的解释和评估：数据挖掘阶段发现出来的模式</span>,<span style="font-family: 宋体">经过评估，可能存在冗余和无关的模式，需要将其剔除。也有可能模式不满足用户要求，这时需要整个过程回退到前一阶段</span></p>
<h1><span style="font-family: 宋体">数据挖掘与</span>OLAP</h1>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <span style="font-family: 宋体">数据挖掘与</span>OLAP<span style="font-family: 宋体">都属于分析型工具，数据挖掘是一种挖掘型工具，它能自动地发现隐藏在数据中的模式，作出预测性分析的分析工具，它的分析过程是自动的。用户不必提出确切的问题。数据挖掘所处的位置较深</span></p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OLAP<span style="font-family: 宋体">是自上而下、不断深入的分析工具，并以可视化的方式呈现给用户。</span>OLAP<span style="font-family: 宋体">更多依靠用户输入问题和假设，但用户先入为主的局限性可能会限制问题和假设的范围，从而影响最终的结论。</span>OLAP<span style="font-family: 宋体">位于较浅的层次</span></p>
<p>&nbsp;&nbsp;&nbsp; <span style="font-family: 宋体">尽管数据挖掘与</span>OLAP<span style="font-family: 宋体">存在着上面的差异，但二者相辅相成<br />
<br />
<br />
Open View 决策分析平台会在2010-2011年推出</span></p><img src ="http://www.blogjava.net/pengminghua/aggbug/293613.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/pengminghua/" target="_blank">彭明华</a> 2009-09-02 16:26 <a href="http://www.blogjava.net/pengminghua/archive/2009/09/02/293613.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>