﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>BlogJava-Tinysun-随笔分类-新技术新概念</title><link>http://www.blogjava.net/tinysun/category/37799.html</link><description /><language>zh-cn</language><lastBuildDate>Fri, 20 Feb 2009 14:45:53 GMT</lastBuildDate><pubDate>Fri, 20 Feb 2009 14:45:53 GMT</pubDate><ttl>60</ttl><item><title>语义网专家Frank van Harmelen揭秘语意网</title><link>http://www.blogjava.net/tinysun/archive/2009/02/17/255165.html</link><dc:creator>何克勤</dc:creator><author>何克勤</author><pubDate>Tue, 17 Feb 2009 10:13:00 GMT</pubDate><guid>http://www.blogjava.net/tinysun/archive/2009/02/17/255165.html</guid><wfw:comment>http://www.blogjava.net/tinysun/comments/255165.html</wfw:comment><comments>http://www.blogjava.net/tinysun/archive/2009/02/17/255165.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.blogjava.net/tinysun/comments/commentRss/255165.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/tinysun/services/trackbacks/255165.html</trackback:ping><description><![CDATA[转至CSDN<br />
所谓&#8220;语义&#8221;就是文本的含义。语义需要理解文本的意思和结构，而与显示方式无关。简单地说，语义网（Semantic Web）是一种能理解人类语言的智能网络，它不但能够理解人类的语言，而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。但目前大多数人对语意网的认识都还存在误区，因此我们特编辑此文为语意网揭秘。<br />
<br />
&nbsp;&nbsp;&nbsp; <strong>记者：常有人说，语义网所要解决的问题，就是30年前人工智能（Artificial Intelligence）里的知识表示（knowledge representation）及归纳逻辑（inductive logics）所要解决的问题。KL-ONE、Cyc以及Minsky的框架（frames）和Sowa的概念图（Conceptual Graphs）等，都属于过去这些工作留下的产物。但是它们都已经失败了。那么语义网以及语义网在本体（ontology）和推理（reasoning）方面的关注，跟这些失败的努力有什么不同呢？<br />
<br />
</strong>　　Frank：其实，大家对语义网存在一种误解，即认为语义网是&#8220;重复人工智能的工作&#8221;。虽然语义网和人工智能（AI）所用的工具有一些相同（比如本体、推理、逻辑等），但它们的目标是完全不同的。实际上，语义网的目标是更为适度的：语义网并不是要构建一个通用的、综合性的、基于Internet的智能系统，而是要实现Web上数据集（datasets）间的互操作（无论数据是结构化、非结构化还是半结构化的）——这一目标更具实践性，更为适度。去年七月，Tim Berners-Lee专门就人工智能与语义网之间的混淆做过一个报告。该报告的摘要如下：语义网不是人工智能，人工智能也不是语义网；人工智能是一个领域，而语义网是一个项目；语义网采用了人工智能里的某些工具，所以人工智能对语义网有一定功劳；语义网将是人工智能的一个极好的应用场景。Tim Berners-Lee还在报告中澄清了关于语义网的其他一些错误说法，例如&#8220;语义网（只或者主要）关注于手工标注的文本文档&#8221;以及&#8220;语义网需要一个可被大家接受的、统一的本体&#8221;等。<br />
<br />
　　<strong>记者：Web 2.0是一个新事物——无论是学术界还是工业界，人人都喜爱它。而另一方面，语义网却由于众多诺言未能兑现而失去关注。关于这两个Web的共存，您有何看法？您认为Web 2.0将对语义网的发展起到什么样的作用？<br />
<br />
</strong>　　Frank：注意问题中的&#8220;语义网由于众多诺言未能兑现而失去关注&#8221;，这是一个错误的前提。<br />
<br />
&nbsp;&nbsp;&nbsp; 我们来看一些准确的信息：<br />
<br />
　　SemTech大会（Semantic Technology Conference）是一个面向工业界的会议，目前为止已经召开过3届，前几届都是在加利福利亚圣何塞（San Jose）召开的。第一年有300人参加，去年有500人参加，而今年的参会人数已经超过了700人。相应地，在欧洲，首届欧洲语义技术大会（European Semantic Technologies Conference）也于去年5月在维也纳召开了。参会人数超过了200人，其中75%都是来自公司的。所以，要么你说错了，要么那几百名公司人士和几十家公司都&#8220;脑袋坏掉了&#8221;。你自己判断吧。<br />
<br />
　　与此相反的是，语义技术正处于产业突破（industrial breakthrough）的过程之中。下面的一段话引自最近（2007年5月）的一篇Gartner报告（Gartner是不会热衷于短命技术的）：&#8220;关键结论：在接下来的10年里，基于Web的技术，将会提高往文档里嵌入语义结构、以及创建结构化词汇表和本体（用于定义术语、概念及关系）的能力。这将极大地推动信息的可见性及信息的开发利用（尤其是在无人工干预下理解文档与推断含义的能力）的发展。&#8221;<br />
<br />
　　幸运的是，Gartner相当明智，没有（像你一样）断言语义网已经夭折，而是对语义网需要多久实现做出了估计：&#8220;实现语义网的伟大宏图，需要多个渐进式的步骤，而且小规模的行动常常是最好的起点。&#8221;<br />
<br />
　　回到刚才问题的主题上：学术界关于Web 2.0与语义网（或者说Web 3.0）是相互补充、而不是竞争的关系，取得了广泛的认同。这是在去年5月于爱丁堡召开的第15届国际万维网大会（WWW2006）上的一个科学座谈会上得出的结论。大家一致认为：Web 2.0门槛较低（易于上手使用），不过能力上限也比较低（folksonomy仅限于此）；而Web 3.0虽然门槛较高（起初的投入需要较多），但能力上限要高得多。<br />
<br />
　　在前面提到的那份Gartner报告里，还有一些重要论断。它建议将语义网和Web 2.0技术结合起来，并预言目前的Web，将由具备轻量语义但易于使用的Web 2.0技术，逐渐发展为较高投入/较高产出的Web 3.0技术。<br />
<br />
　　<strong>记者：您认为用自动化方法——也就是说，知识抽取与推理（knowledge extraction and inference）中的自然语言处理（natural language processing）、文本挖掘（text mining）及统计等方法——来学习本体及实体间的关系怎么样？您认为这些技术对手工编辑本体的方法，是一种补充，还是遏止？您认为这些技术能够起到促进作用吗？还是它们注定会失败？<br />
<br />
</strong>　　Frank：我对于本体的获取以及对这些本体里的数据对象的分类的态度是：有用就好。仅依靠手工来构建本体，显然是成本过高的，而且也限制了可被编纂与分类的知识的量。所以，我希望你提到这些技术能为语义技术作出最大的贡献。我不觉得这些技术将&#8220;注定失败&#8221;，相反，我认为它们的有益贡献将日益增大，关于这一点我相当乐观。<br />
<br />
　　<strong>记者：所有重大的技术发明与里程碑都是以其 killer?app 的出现为标志的。那么语义网的 killer app 会是什么？究竟有没有？</strong><br />
<br />
　　Frank：我觉得关于&#8220;killer app&#8221;这一反复问及的问题总是有些幼稚。举个例子：我们同不同意?XML的广泛采纳是一项重要的技术创新？但谁是XML的&#8220;killer app&#8221;？这样一个&#8220;killer app&#8221;存在吗？不。存在的只是许许多多的场合，XML在这些场合下能够&#8220;在背后&#8221;起到促进作用。语义网技术主要是基础设施技术（infrastructure technology），而基础设施技术是存在于背后、并非用户直接可见的。你所能感受到的，只是诸如：网站变得更人性化了（因为背后存在语义网技术，你的个人兴趣概要（profile）可以与网站的数据源进行互操作）、搜索引擎对结果的聚类（clustering of results）做得更好了（因为搜索引擎在背后采用具有含义的本体来对搜索结果加以分类）以及桌面搜索工具能够把文档作者的姓名与你的地址簿里的?Email地址关联起来了（因为这些数据格式在背后通过暴露其语义来实现互操作）等，但这些应用不会在其界面上注明&#8220;语义网技术&#8221;。语义网技术就像是发动机汽缸壁上的Nikasil涂层，虽然很少有司机知道它，但司机们能够察觉到燃料消耗的减少、最高时速的提升以及引擎寿命的延长等等。语义网技术就是目前正在开发着的、下一代人类友好的计算机应用的Nikasil涂层。<br />
<br />
译/徐涵<br />
<br />
(来自：《程序员》杂志 <a href="http://www.programmer.com.cn/">http://www.programmer.com.cn/</a>)<br />
 <img src ="http://www.blogjava.net/tinysun/aggbug/255165.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/tinysun/" target="_blank">何克勤</a> 2009-02-17 18:13 <a href="http://www.blogjava.net/tinysun/archive/2009/02/17/255165.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>