XML语言初识

xml语言简介: 1,什么是xml,为什么学习xml
xml全称是Extensible Markup Language的,翻译过来是可扩展标记语言。xml技术是w3c组织发布的,目前推荐遵循的是w3c组织2000年发布的xml1.0规范。最新更新的规范版本是xml1.1;
那为什么要学习xml呢?在现实生活中大量存在有关系的数据,如:中国 包含北京 北京 包含海淀区和朝阳区等,那么怎么给计算描述这种数据关系呢,就是用xml来描述。
xml语言的出现,根本目标就是描述在现实生活中经常出现的有关系的数据。
在xml语言中,它允许用户自定义标签,一个标签用于描述一段数据;一个标签可分为开始标签<>和结束标签,在开始标签和结束标签之间,又可以使用其他标签描述其他数据,以此来实现数据关系的描述。如下:
<中国>
? <北京>
? <海淀区>
? <朝阳区>
?

xml常见应用场景
xml技术除了用于保存有数据关系的数据之外,它还经常用作软件的配置文件,以及描述程序模块之间的关系。
在一个软件系统中,为提高系统的灵活性,它所启动的模块通常由其配置文件决定,例如一个软件在启动时,它需要启动A,B两个模块,而A,B这两个模块在启动时又分别需要启动A1,A2,B1,B2模块的支持,为了准确的描述这种关系,那么用xml来描述这种关系最为合适。
小故事:w3c组织在一开始推出xml语言的时候初衷是希望替代掉html,结果是xml学习成本高没替代了,为了让html的学习者过度到xml,中间还推出了xhtml。现在是肯定不会替代掉html了 html5以及火起来了。xml也就逐渐成了配置文件。
xml语法详解: 一个xml文件分为一下几个部分:
1,文档声明
2,元素
3,元素属性
【XML语言初识】4,注释
5,CDATA区、特殊字符
6,处理指令(processing instruction)
1,文档声明:
最简单的声明语法
xml文件的声明是在文档的第一行写
用encoding属性说明文档的字符编码:

用standalone属性说明文档是否独立:

2,元素
xml元素指xml文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式;
包含标签体:www.baidu.com
不包含标签体的: 简写为:
一个标签中也可以嵌套若干个子标签,但所有标签必须是合理嵌套,不允许交叉嵌套;
格式良好的xml文档必须有且仅有一个根标签,其他标签都是这个根标签的子孙标签。
对于xml标签中出现的所有空格和换行,xml解析程序都会当作标签内容进行处理。
例如:这两段内容就是不同意义的
第一个 www.baidu.com
第二个www.baidu.com
由于在xml中,空格和换行都会被当作内容处理,所以在编写xml文件时,使用换行和缩进等方式来让原文件内容具有良好的可读性书写习惯是可能要改变的。
元素的命名规范: xml元素可以包含字母、数字以及其他一个些可见字符,但必须遵守下面一些规范:
1,区分大小写,如和是两个不同的标记。
2,不能以数字或“_”(下划线)开头。
3,不能以xml或XML或Xml等开头。
4,不能包含空格。
5,名称中间不能包含冒号。
3,元素属性:
一个标签可以有多个属性,每个属性都有他自己的名称和取值。
如:
属性值一定要用双引号或单引号引起来。
定义属性必须遵循与标签相同的命名规范。
在xml技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描述。
如: text
4,注释
xml文档中采用的注释格式是 ;
注意:xml声明之前不能有注释,注释不能嵌套注释;
5,CDATA区、特殊字符
我们在编写xml文档时,有些内容不想让解析引擎解析那么我们可以把这些内容放在CDATA区,放在CDATA区域里的内容不能会被解析,而是被直接原封不动输出。
,CDATA区中的www.baidu.com会被原样输出。
转义字符:对于一些单个字符,若想显示其原始样式,也可以使用转义的形式处理;
XML语言初识
文章图片
1525703689533.jpg 6,处理指令
处理指令:简称PI(processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容;
例如:在xml文档中可以使用xml-stylesheet指令通知xml解析引擎 应用css文件显示xml文档内容。

处理指令必须以“”作为结尾,xml声明语句就是最常见的一种处理指令。

    推荐阅读