XML是什么


(来源:http://www.zdnet.com.cn)

同HTML一样, XML (可扩展标识语言)是通用标识语言标准(SGML)的一个子集,它是描述网络上的数据内容和结构的标准。尽管如此,XML不象HTML,HTML仅仅提供了在页面上显示信息的通用方法(没有上下文相关和动态功能) ,XML则对数据赋予上下文相关功能,它继承了SGML的大部分功能,却使用了不太复杂的技术。.

为了使得SGML显得用户友好,XML重新定义了SGML的一些内部值和参数,去掉了大量的很少用到的功能,这些繁杂的功能使得SGML在设计网站时显得复杂化。XML保留了SGML的结构化功能,这样就使得网站设计者可以定义自己的文档类型,XML同时也推出一种新型文档类型,使得开发者也可以不必定义文档类型。

因为XML是W3C制定的,XML的标准化工作由W3C的XML工作组负责,该小组成员由来自各个地方和行业的专家组成,他们通过email交流对XML标准的意见,并提出自己的看法 (www.w3.org/TR/WD-xml)。因为XML 是个公共格式, (它不专属于任何一家公司),你不必担心XML技术会成为少数公司的盈利工具,XML不是一个依附于特定浏览器的语言。

XML的基本结构类似于SGML。XML文档很简单,可以没有文档类型定义,例如:

<?XML version="1.0" standalone="yes"?>
<conversation>
<greeting>Hello, world!</greeting>
<response>Stop the planet, I want to get off!</response>
</conversation>

XML的优势是很显然的,因为XML语言可以充分利用网站内容的标准及其结构化描述。 XML可以使搜索引擎设计得更加有成效。使得索引不再有必要。XML也可以实现网站内容的个人化观看风格,这样,用户可以按照个人习惯和兴趣来查看标准文档中的相关信息。XML带来的最后一个好处是,动态出版服务器可以同时从几个服务器中,提取内容,如同管理静态内容一样,网站设计者可以通过XML来管理信息。

XML定义了内容而不是表现形式,这是HTML和XML的基本区别。这样,在你的浏览器中观看XML 页时,其显示格式仅仅取决于开发者的设计。换句话说,控制XML页的输出格式是开发者,而不是浏览器。例如,IE 4.0使用了XML解析器,可以读入XML页,并并且可以从XML页中提取数据,供另外的程序访问。你可以用传统的HTML来显示数据。微软公司正在把其CDF(频道定义格式)设计成XML格式。

你可以对任何数据(例如颜色,名称或者地点)赋予其属性,这种属性称为XML文档描述,或者称为元数据。元数据也代表更抽象的概念,例如同特定的文档相联系的某行业术语。你也可以使用XML对任何现有的元数据标准进行编码。

因为XML不依赖于任何特定类型的元数据格式,各种技术厂家的用户组织定义出自己的元数据标准,并不会有什么风险。换句话,你不能够把XML变成特定类型数据的专有产品。资源描述框架 (RDF)标准,目前处于建议阶段,其目的就是把所有的元数据集中到一起,这样,数据可以被大家共享。

为了使用XML,网站设计者们必须对要标记的文档进行分析,然后,两件事情,选做其中的一件,一件事情是借用一家工业集团制定的称为的文件类型定义的标准(DTD),它用来描述出现在文档中的元素。另外一件事情是自己创建标记,设计出自己的一套标记集合,例如, <lastname> 或者 <location> ,来满足实际应用的需求。

XML家族标准

Technology Purpose

XML

基本文档结构和语法

DTD

XML文档的语法定义

XSL

转换和格式设置

DOM

创建和操纵XML的API

XLink/Xpointer

Richer links

RDF

元数据和语义网络

XML

取代DTD的大纲

Namespaces

同一文档中的多个词汇表