﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>语源科技BlogJava-我的一亩三分地</title><link>http://www.blogjava.net/mario/</link><description /><language>zh-cn</language><lastBuildDate>Sun, 12 Apr 2026 15:03:00 GMT</lastBuildDate><pubDate>Sun, 12 Apr 2026 15:03:00 GMT</pubDate><ttl>60</ttl><item><title>自己挖坑自己填-元模型</title><link>http://www.blogjava.net/mario/archive/2010/09/12/331852.html</link><dc:creator>西北狼</dc:creator><author>西北狼</author><pubDate>Sun, 12 Sep 2010 15:15:00 GMT</pubDate><guid>http://www.blogjava.net/mario/archive/2010/09/12/331852.html</guid><wfw:comment>http://www.blogjava.net/mario/comments/331852.html</wfw:comment><comments>http://www.blogjava.net/mario/archive/2010/09/12/331852.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.blogjava.net/mario/comments/commentRss/331852.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/mario/services/trackbacks/331852.html</trackback:ping><description><![CDATA[<div>
<p style="text-indent: 28pt; margin: 0cm 0cm 0pt" class="MsoListParagraph"><span style="font-family: 宋体; font-size: 14pt">不少朋友抱怨我的博客晦涩难懂，实际<a onclick="javascript:tagshow(event, '%D4%AA%CA%FD%BE%DD');" href="javascript:;" target="_self"><u><strong>元数据</strong></u></a>、主数据、数据质量、数据分析已经非常小众了，小众的以至于在ITPUB发博都找不到分类，实际这也是我看好它的原因。随着未来智慧地球、物联网的建设，<a onclick="javascript:tagshow(event, '%D0%C5%CF%A2%BB%AF');" href="javascript:;" target="_self"><u><strong>信息化</strong></u></a>进程大大加快，需要<a onclick="javascript:tagshow(event, '%D0%E9%C4%E2%BB%AF');" href="javascript:;" target="_self"><u><strong>虚拟化</strong></u></a>（<a onclick="javascript:tagshow(event, '%D4%C6%BC%C6%CB%E3');" href="javascript:;" target="_self"><u><strong>云计算</strong></u></a>）、IT资源监管（数据资产、软硬件资产）、移动应用。我们的小众是属于数据资产监管中的一部分。</span></p>
<p style="text-indent: 28pt; margin: 0cm 0cm 0pt" class="MsoListParagraph"><span style="font-family: 宋体; font-size: 14pt">上周挖了不少坑，本周先填一个坑，填元数据模型的坑。元数据模型简称元模型。元数据有哪几类元数据模型就有几类，粗分下分为数据移动（ETL）元数据、数据分析（BI）元数据、数据存储元数据，数据质量元数据、数据管控元数据等。下面逐一介绍下这几类元数据：</span></p>
<p style="text-indent: 28pt; margin: 0cm 0cm 0pt" class="MsoListParagraph"><span style="font-family: 宋体; font-size: 14pt">数据存储元数据模型：要分结构化和非结构化两种介绍，先说大家常见的结构化数据的元数据模型。我们知道描述<a onclick="javascript:tagshow(event, '%CA%FD%BE%DD%BF%E2');" href="javascript:;" target="_self"><u><strong>数据库</strong></u></a>信息需要Catalog、Schema、Table、View、Trigger和storage&nbsp;process，当然一般把Trigger和SP理解为数据移动，这些元数据都有哪些属性你可以看看power designer。对于非结构化数据解决方案不多，因为对于非结构化数据与查询息息相关，一般针对索引条件建立元数据模型。</span></p>
<p style="text-indent: 28pt; margin: 0cm 0cm 0pt" class="MsoListParagraph"><span style="font-family: 宋体; font-size: 14pt">数据移动元数据模型：这一直是我思考的问题，参照主流ETL工具我们可以定义Workflow、Task、mapping、source、target等，记得source与target与数据存储元数据模型可以互联。Mapping要记录source至target间的转换过程。</span></p>
<p style="text-indent: 28pt; margin: 0cm 0cm 0pt" class="MsoListParagraph"><span style="font-family: 宋体; font-size: 14pt">数据应用元数据模型：主要考虑带OLAP引擎的CUBE模型，主要有：Cube、Dimension、member Of、Hierarchy、Fact等。</span></p>
<p style="text-indent: 28pt; margin: 0cm 0cm 0pt" class="MsoListParagraph"><span style="font-family: 宋体; font-size: 14pt">讲到这里，基本解决了的元数据<a onclick="javascript:tagshow(event, '%B9%DC%C0%ED');" href="javascript:;" target="_self"><u><strong>管理</strong></u></a>中元数据存储和展示的问题。但这并是问题的本质，实质是元数据模型与CWM之间的关系，但为了避免文章晦涩难懂，我跳过这些。</span></p>
</div>
<img src ="http://www.blogjava.net/mario/aggbug/331852.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/mario/" target="_blank">西北狼</a> 2010-09-12 23:15 <a href="http://www.blogjava.net/mario/archive/2010/09/12/331852.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>刨根问底元数据</title><link>http://www.blogjava.net/mario/archive/2010/09/11/331765.html</link><dc:creator>西北狼</dc:creator><author>西北狼</author><pubDate>Sat, 11 Sep 2010 13:09:00 GMT</pubDate><guid>http://www.blogjava.net/mario/archive/2010/09/11/331765.html</guid><wfw:comment>http://www.blogjava.net/mario/comments/331765.html</wfw:comment><comments>http://www.blogjava.net/mario/archive/2010/09/11/331765.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.blogjava.net/mario/comments/commentRss/331765.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/mario/services/trackbacks/331765.html</trackback:ping><description><![CDATA[<font size="4">元数据的定义就五字-数据的数据，这种极度抽象的定义直接导致我们对元数据的认知是极度抽象的，这种极度抽象就造成了元数据的神化，我想接下来要做的就是将元数据拉下神坛。<br />
&nbsp;&nbsp;&nbsp; 元数据是数据的数据，我们一般采用数据模型对抽象定义数据及数据的关系，那么元数据一定也能被数据模型表述。那元数据的数据模型是什么样的？它与数据的数据模型有哪些异同。目前元数据建模标准体系，我们一般采用OMG（请记住这个国际知名的标准化组织，因为除了元数据模型标准外，它们还制定了MDA、UML、XMI等）的CWM标准。那么一个标准的元数据模型体系由什么组成呢，除了包外，每个元模型由<a onclick="javascript:tagshow(event, '%B9%DC%C0%ED');" href="javascript:;" target="_self"><u><strong>管理</strong></u></a>、分析、资源、基础和对象。管理是指数据仓库操作和过程；分析是指OLAP、数据挖掘、信息可视化、ETL；资源是指对象、关系、记录、多维、XML；基础是指业务信息、数据类型、表达式、键和索引、<a onclick="javascript:tagshow(event, '%C8%ED%BC%FE');" href="javascript:;" target="_self"><u><strong>软件</strong></u></a>部署、类型映射。介绍了这么如果你搞过业务智能你会明白CWM描述了整个数据仓库的全部，如果你参与过我们的项目会知道，这是我们数据管控平台的理论依据。那么数据仓储的元数据如何定义？数据移动的元数据如何定义？数据分析的元数据如何定义？先挖坑以后慢慢填。<br />
&nbsp;&nbsp;&nbsp;&nbsp; 下面说说元数据如何管理如何应用：首先是元数据获取，元数据获取的内容包括分析元数据、数据仓储元数据、数据转换元数据等等，元数据获取方式方式包括自动获取或手工获取，当然元数据获取最难的是非结构化元数据的获取，但是也有解决的办法只是这里存在获取准确度的问题，为了保证文档的纯洁性，我再次挖坑。其次是元数据仓储，简单的说包括<a onclick="javascript:tagshow(event, '%CA%FD%BE%DD%BF%E2');" href="javascript:;" target="_self"><u><strong>数据库</strong></u></a>表结构如何存储，CUBE的结构如何存储，ETL过程如何存储等等，实际这是个模型的问题，但这纯粹存储模型的问题。同上，我再次挖坑。最后是元数据应用，包括血缘分析、重要度分析、相似度分析等等。<br />
&nbsp;&nbsp;&nbsp; &nbsp;最后说下元数据管理的衍生业务：一是元数据的质量管理，这是个鸡和蛋的问题，为了保证数据质量我们引入元数据定义数据的质量，但引入元数据后又要保证元数据的质量；二是基于元数据的数据仓库开发，同志们baidu都有，我不说了；三是基于元数据的安全管理，引入元数据除解决质量问题外，就是密级问题；四是基于元数据的指标体系管理。<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 挖了很多坑，终于理出元数据的脉络，当然元数据管理系统也初见轮廓。</font>
<img src ="http://www.blogjava.net/mario/aggbug/331765.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/mario/" target="_blank">西北狼</a> 2010-09-11 21:09 <a href="http://www.blogjava.net/mario/archive/2010/09/11/331765.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>乱弹数据仓库(二)-ODS</title><link>http://www.blogjava.net/mario/archive/2007/07/29/133118.html</link><dc:creator>西北狼</dc:creator><author>西北狼</author><pubDate>Sun, 29 Jul 2007 06:01:00 GMT</pubDate><guid>http://www.blogjava.net/mario/archive/2007/07/29/133118.html</guid><wfw:comment>http://www.blogjava.net/mario/comments/133118.html</wfw:comment><comments>http://www.blogjava.net/mario/archive/2007/07/29/133118.html#Feedback</comments><slash:comments>2</slash:comments><wfw:commentRss>http://www.blogjava.net/mario/comments/commentRss/133118.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/mario/services/trackbacks/133118.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要:   乱弹数据仓库的第二弹，ODS的功能和作用。希望对大家有用&nbsp;&nbsp;<a href='http://www.blogjava.net/mario/archive/2007/07/29/133118.html'>阅读全文</a><img src ="http://www.blogjava.net/mario/aggbug/133118.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/mario/" target="_blank">西北狼</a> 2007-07-29 14:01 <a href="http://www.blogjava.net/mario/archive/2007/07/29/133118.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>软件项目质量初探-客户部分</title><link>http://www.blogjava.net/mario/archive/2007/07/02/127688.html</link><dc:creator>西北狼</dc:creator><author>西北狼</author><pubDate>Mon, 02 Jul 2007 14:12:00 GMT</pubDate><guid>http://www.blogjava.net/mario/archive/2007/07/02/127688.html</guid><wfw:comment>http://www.blogjava.net/mario/comments/127688.html</wfw:comment><comments>http://www.blogjava.net/mario/archive/2007/07/02/127688.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.blogjava.net/mario/comments/commentRss/127688.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/mario/services/trackbacks/127688.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要:    关于客户方面对软件项目影响，最近也是遇到了几个类似的项目，有感而发写下来，希望对大家有用。&nbsp;&nbsp;<a href='http://www.blogjava.net/mario/archive/2007/07/02/127688.html'>阅读全文</a><img src ="http://www.blogjava.net/mario/aggbug/127688.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/mario/" target="_blank">西北狼</a> 2007-07-02 22:12 <a href="http://www.blogjava.net/mario/archive/2007/07/02/127688.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>乱弹数据仓库（一）-概述</title><link>http://www.blogjava.net/mario/archive/2007/06/27/126671.html</link><dc:creator>西北狼</dc:creator><author>西北狼</author><pubDate>Wed, 27 Jun 2007 15:11:00 GMT</pubDate><guid>http://www.blogjava.net/mario/archive/2007/06/27/126671.html</guid><wfw:comment>http://www.blogjava.net/mario/comments/126671.html</wfw:comment><comments>http://www.blogjava.net/mario/archive/2007/06/27/126671.html#Feedback</comments><slash:comments>4</slash:comments><wfw:commentRss>http://www.blogjava.net/mario/comments/commentRss/126671.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/mario/services/trackbacks/126671.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要:   乱弹数据仓库，用通俗易懂的方式讲清楚数据仓库。让老鸟见笑了。&nbsp;&nbsp;<a href='http://www.blogjava.net/mario/archive/2007/06/27/126671.html'>阅读全文</a><img src ="http://www.blogjava.net/mario/aggbug/126671.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/mario/" target="_blank">西北狼</a> 2007-06-27 23:11 <a href="http://www.blogjava.net/mario/archive/2007/06/27/126671.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>项目管理几件宝</title><link>http://www.blogjava.net/mario/archive/2007/06/26/126386.html</link><dc:creator>西北狼</dc:creator><author>西北狼</author><pubDate>Tue, 26 Jun 2007 09:50:00 GMT</pubDate><guid>http://www.blogjava.net/mario/archive/2007/06/26/126386.html</guid><wfw:comment>http://www.blogjava.net/mario/comments/126386.html</wfw:comment><comments>http://www.blogjava.net/mario/archive/2007/06/26/126386.html#Feedback</comments><slash:comments>6</slash:comments><wfw:commentRss>http://www.blogjava.net/mario/comments/commentRss/126386.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/mario/services/trackbacks/126386.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要:   总结前一阶段项目成功与失败的地方，有些方法和想法与各位share下。&nbsp;&nbsp;<a href='http://www.blogjava.net/mario/archive/2007/06/26/126386.html'>阅读全文</a><img src ="http://www.blogjava.net/mario/aggbug/126386.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/mario/" target="_blank">西北狼</a> 2007-06-26 17:50 <a href="http://www.blogjava.net/mario/archive/2007/06/26/126386.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>