(本系列文章是我学习的过程中,整理出来的笔记,如有错漏,看官请一定不吝回复告知我,让我能认识自己的不足,并改进错误。非常感谢!)

    XML的全称是Extensible Markup Language,意思是可扩展的标识语言,是SGML(Standard Generalized Markup Language)的一个子集。1998年2月,W3C组织发布了XML1.0标准,其目的是为了在Web上能以现有的超文本标识语言(HTML)的使用提供,接收和处理通用的SGML。XML以一种开放的,自我描述的方式定义了数据结构,在描述数据内容的同事能突出对结构的描述,从而体现出数据与数据之间的关系。XML的最新版本是1.1,于2004年2月4日发布。目前大多数的应用还是基于XML1.0的推荐标准。1.0版本的规范在下面网址中定义:
http://www.w3.org/TR/2004/REC-xml-20040204/

    XML不是(X)HTML的扩展,两者之所以看起来很像,是因为它们都是SGML发展而来的标识语言,语法很相似,标识的使用也很相似。HTML只是SGML的一个子应用,它的DTD(Document Type Definition)被固定下来,所以不能用来定义新的应用。而XML不同,我们可以根据自己的需要,随意定义我们自己的DTD,所以,利用XML,可以定义出新的应用,比如,RDF(Resource Description Framework,资源描述框架,blog中经常看见的RSS1.0就是RDF Site Summary,RDF网站摘要,关于RSS,我将在潜心学习RSS中去认识它),CDF(Channel Definition Format,通道定义格式,微软在IE4.0中引入的一个新功能。基于CDF,网站可以通过活动通道将数据聚合到设置为活动桌面的用户桌面上)。

    XML规范的制定者之一Tim Bray说,XML的设计出发点是取SGML的优点,去除复杂的部分,使其保持轻巧,可以在Web上工作。

    XML的应用非常广泛,计算机和网络的世界里,处处活跃着它矫健轻快的身影,或为配置文件,或为数据存储,或为数据传输使用的格式。XML已经成为事实上的数据交换格式的标准,使用XML,意味着所有设备,比如手机,PDA,信息家电等等,都可以轻松的读取,解析你的数据。
   
    XML很重要的两个特性:
    一:XML文档仅仅描述数据,它不关心数据是如何表现外观的,比如字体大小,颜色,间距之类的,所以它能将数据和数据的表现方式完全的分离开,这个特性很重要,HTML就万万做不到这种完全的分离,所以W3C组织不得不推出一个XHTML,作为HTML向XML过度的产物。

    二:XML对文档的格式要求非常严格,符合标准的XML文档就是格式良好的XML文档(Well-Formed XML Documents)。这是使得XML文档能被普遍认可的一个特点。严格的文档格式,减轻了解析的复杂性。相对来说,HTML的文档格式就非常松散,解析起来就比较复杂,也造成了浏览器兼容的问题。XML文档格式的要求有下面几点:
    1、所有的标签都必须关闭,开始标签有对应的结束标签,空标签必须被关闭。
    2、所有的标签都区分大小写
    3、所有的标签都必须合理嵌套
    4、所有的标签的属性值必须用收引号("")或单引号('')括起来
    5、XML文档有且只能有一个根元素
    6、(还有其他的嘛?)

本章到此结束,重点掌握XML与HTML的异同点,XML的两个特性。
下一章学习XML的结构。