[这个贴子最后由bigblock在 2003/12/14 05:57pm 第 1 次编辑]
第一个XML文档
随着Internet的发展,越来越多的信息进入互联网,信息的交换、检索、保存及再利用等迫切的需求使HTML这种最常用的标记语言已越来越捉襟见肘。HTML将数据内容与表现融为一体,可修改性、数据可检索性差,而XML借鉴了HTML与数据库、程序语言的优点,将内容与表现分开,不仅使检索更为方便,更主要的是用户之间数据的交换更加方便,可重用性更强。
XML是一种元标记语言,没有许多固定的标记,为WEB开发人员提供了更大的灵活性。当我们使用HTML时,标记只是简单的表示内容的显示形式,而与表示的内容没有任何关联,为文档的进一步处理带来极大的不便。比如要表示个人简历,用HTML的表示方式如下:
< HTML >
< BODY >
< TABLE border=1 cellspacing=0 >
< TH >姓名< TD >禹希初< TH >性别< TD >男< TH >生日< TD >1977.5
< TR >
< TH >技能< TD colspan=5 >数据库设计与维护、WEB开发
< /TABLE >
< /BODY >
< /HTML >
在这里,我们无法从标记TH、TD得知其内容表示什么,如果用XML,相应的文档(文件名:个人简历.xml)就可写成如下形式:
< ?xml version="1.0" encoding="GB2312"? >
< resume >
< name >禹希初< /name >
< sex >男< /sex >
< birthday >1977.5< /birthday >
< skill >数据库设计与维护、WEB开发< /skill >
< /resume >
说明:
version──规定了XML文档的版本,此处只能是1.0;
encoding── 此处规定了XML文档的编码类型,此处取值为“GB2312”,也就是“简体中文”。
对比两例,使用XML我们可以做到自定义标记,用标记表明内容的含义。这样在Internet上交流资料时,为用计算机处理文档提供了极大的方便,同时我们阅读源文件时也不会被一大堆格式弄得晕头转向。
然而,由于XML并没有为标记规定显示方式,如果我们在游览器中查看以上两个文档(建议使用IE5.0或更新版本),我们将看到xml文档并没有以诸如表格的方式来显示。难道我们就不能像HTML一样显示文档吗?回答是否定的。以个人简历为例,需要另建一个格式文件说明各个标记的显示方式,其内容如下(假设文件名为resume.css):
resume{ display: block;}
name{ display: block; font-size:120%;}
sex{ display:block; text-indent:2em}
birthday{ display:block; text-indent:2em}
skill{ display:block; text-indent:2em}
说明:
以上均为CSS样式,建议读者参考有关资料熟悉CSS,在以后学习中必须用到,此处由于篇幅关系不作介绍。建立文件resume.css后,在个人简历.xml文件的第一行后添加以下文字:
< ?xml:stylesheet type="text/css" href="resume.css"? >
说明:
此处表示引用一个外部CSS样式文件,其中type规定样式类型(可取值为text/css或text/xsl),href规定文件路径。
保存文件,再以IE5.0打开文件。怎么样?格式有些不一样吧。好象还不令人满意,文档内容是清晰了,但显示效果比HTML编写的文档就差得多了,XML编写的文档就只能以这种方式显示吗?!
提示:
1. 为了更好的理解与掌握XML,建议大家熟悉HTML 4.0与CSS 2.0语法;掌握JavaScript、VBscript中至少一种;编程经验、对数据库理论与SQL的了解均能使大家在学习XML时获益。
2. XML文档中标记必须成对出现,如果是空标记也必须有前加“/”的同名标记结束,或使用此种文式< xml_mark/ >表示空标记。
3. XML以及下周将要介绍的XSL文档,属性值必须用双引号(")或单引号(')括起来。
4. XML文档必须是好结构的(XSL文档也是XML文档中一种),也就是说标记必须有结束标记、标记可以嵌套但不可交叉,如
< outer >< inner >< /inner >< inner/ >< /outer >
是合法的,而下面的形式
< outer >< inner >< /outer >< /inner >
则是错误的。如果XML文档在浏览时出错,多半是违反了上面提到的规则。
XSL入门
上期我们讲到用CSS(层叠样式表)来格式化XML文档,其效果并不很令人满意。实际上CSS用来格式化HTML标记比较合适些,只是因为它简单才在上例中采用。
XML在更多的时候只是一种数据文件,怎样将它变为我们日常所看到的HTML格式那样的文件呢?如果我们将XML文件比作结构化的原料的话,那么XSL就好比“筛子“与“模子“,筛子选取自己需要的原料,这些原料再通过模子形成最终的产品:HTML。
这个模子大致是这样:我们先设计好表现的页面,再将其中需要从XML中获取数据来填充内容的部分“挖掉“,然后用XSL语句从XML中筛出相关的数据来填充。一言以譬之:这XSL实际上就是HTML的一个“壳子“,XML数据利用这个“壳“来生成“传统“的HTML。
XML在展开时是一个树形结构,我们将树形结构中自定义标记称为节点,节点之间存在父子、兄弟关系,我们要访问其中的结点从根结点就要以”/”来层层进入。
在XSL这个壳中,我们要从原料库??XML里提取相关的数据,就要用到XSL提供的模式化查询语言。所谓模式化查询语言,就是通过相关的模式匹配规则表达式从XML里提取数据的特定语句,即我们上所说的“筛子“。
参考微软的”XSL开发者指南”,我们大致可将模式语言分为三种:
选择模式
< xsl:for-each >、< xsl:value-of >,和 < xsl:apply-templates >
测试模式
< xsl:if > 和< xsl:when >
匹配模式
< xsl:template >
我们现在就分别对之进行介绍。
一、 选择模式
选择模式语句将数据从XML中提取出来,是一种简单获得数据的方法,这几个标记都有一个select属性,选取XML中特定的结点名的数据。
1、< xsl:for-each >
如在XML中有这样的数据:
< author >
< name >小禹< /name >
< name >春华< /name >
< name >秋实< /name >
< /author >
我们要读取这三个作者名字,是一个一个地按”author/name”方法来读取吗,可有多个这样的name呀?如果有一种程序性的语句来循环读取有多好啊!
想得很对,XSL提供了这样的具有程序语言性质的语句< XSL:for-each >
用它读取这三个作者名字的方法如下:
< xsl:for-each select=”author/name” >
…….
< ./xsl:for-each >
select,顾名思义:选取,它可以选定XML中特定唯一的标记,也可以选择某一类相同的标记,我们称之为结点集。
语法:
< xsl:for-each select="pattern" order-by="sort-criteria-list">
属性:
1. select
根据XSL样式查询考察上下文以决定哪类结点集(满足select条件)使用此样式描述。作为一种简化的表示就是,如果你想对文档中的某一种标记的内容的显示方式进行格式化,就可以将让select等于此元素的标记名。例如欲对标记xml_mark进行格式化,即可用如下方式表示:
< xsl:for-each select="xml_mark" >
< !--样式定义-- >
< /xsl:for-each >
2. order-by
以分号(;)分隔、作为排序标准的列表。在列表元素前添加加号(+)表示按此标记的内容以升序排序,添加减号(-)表示逆序排序。作为一种简化的表示就是,排序标准列表就是由select规定的标记的子标记的序列,每个标记之间以(;)分隔。
2、< xsl:value-of >
< xsl:for-each >模式只是选取节点,并没有取出节点的值,好比猴子只是爬到了树的某个枝干上,那么就用< xsl:value-of >来摘“胜利果实“吧!
语法:
< xsl:value-of select="pattern" >提取节点的值
属性:
select用来与当前上下文匹配的XSL式样。简单的讲,如果要在XSL文档某处插入某个XML标记(假定是xml_mark标记)的内容,可用如下方式表示:
< xsl:value-of select="xml_mark" >< /xsl:value-of >
或
< xsl:value-of select="xml_mark"/ >
示例:
此处仍以上期的个人简历的作为例子,我们需要对文件(个人简历.xml)作一定修改,确切的说是将其中的第二行
< ?xml:stylesheet type="text/css" href="resume.css"? >
修改为
< ?xml:stylesheet type="text/xsl" href="resume.xsl"? >
然后建立一个新文件:resume.xsl,其内容如下:
< ?xml version="1.0" encoding="GB2312"? >
< HTML xmlns:xsl="http://www.w3.org/TR/WD-xsl" >
< HEAD >
< TITLE >个人简历< /TITLE >
< /HEAD >< BODY >
< xsl:for-each select="resume" >
< P/ >
< TABLE border="1" cellspacing="0" >
< CAPTION style="font-size: 150%; font-weight: bold" >
个人简历
< /CAPTION >
< TR >
< TH >姓名< /TH >< TD >< xsl:value-of select="name"/ >< /TD >
< TH >性别< /TH >< TD >< xsl:value-of select="sex"/ >< /TD >
< TH >生日< /TH >< TD >< xsl:value-of select="birthday"/ >< /TD >
< /TR >
< TR >
< TH >技能< /TH >< TD colspan="5" >< xsl:value-of select="skill"/ >< /TD >
< /TR >
< /TABLE >
< /xsl:for-each >
< /BODY >
< /HTML >
完成这些以后再来让我们看一下辛勤劳动的成果,怎么样?效果不错吧。更酷还在后头呢。现在我们对文件(个人简历.xml)作进一步的修改:
1. 在标记< resume >前添加一个新标记< document >;
2. 将标记对< resume >< /resume >之间的内容(包括这一对标记)复制并粘贴在其后,并在最后用< document >结束。
3. 以Notepad.exe打开文件resume.xsl,在标记< HTML >之后添加文字:< xsl:for-each select="document" >;在标记< /HTML >之前添加文字:< /xsl:for-each >,保存文件。
4. 在浏览器中打开文件(个人简历.xml)。看到了什么?两份个人简历!
就这样,利用XML我们可以编写内容与样式完成分离的文档!当然,XSL文件比一般的HTML文件要复杂一些,然而一旦完成则可用于格式化所有同类的XML文档。
XSL模板与匹配模式
经过前几日的学习,我们学习了XHTML文档的编写和以及三个XSL元素,已能编写相当灵活的XSL文档,今天将学习的是XSL模板的编写。我们都知道,短的文档、程序十分好读,但当规模增大后,其复杂性也以更快的速度增加。
前面我们学了< xsl:for-each >、< xsl:value-of >等,可以用它们对XML数据实现简单的格式化输出,但如果遇到比较复杂的XML格式输出,将XSL按照要求依次写下来的话,一是设计困难,可扩展性差,不利于人员之间的分工协作;另则,可修改性很差,可能会出现牵一发而动全军的情况,不利于维护。程序中模块化设计逐步细化的方法在这里得到了应用!
XSL模板将XSL的设计细化成一个个模板(块),最后再将这些模板(块)组合成一个完整的XSL;好比船与集装箱,我们不是将所有的货物一件件地堆起来,而是装在各自的集装箱中,然后再在船上将这些集装箱堆放起来。这种方法可以使你先从整体上考虑整个XSL的设计,然后将一些表现形式细化成不同的模块,再具体设计这些模块,最后将它们整合在一起,这样,将宏观与微观结合起来,符合人们条理化、规范化要求。
装集装箱??书写模板(块):< xsl:template >
< xsl:template >
语法:
< xsl:template match="node-context" language="language-name" >
属性:
match ── 确定什么样的情况下执行此模板。作为一种简化的说明,在此处使用标记的名字;其中最上层模板必须将match设为“/”
language ── 确定在此模板中执行什么脚本语言,其取值与HTML中的SCRIPT标记的LANGUAGE属性的取值相同,缺省值是Jscript
< xsl:template >用match属性从XML选取满足条件的节点,征对这些特定的节点形成一个特定输出形式的模板。
吊集装箱上船-??调用模板(块):< xsl:apply-templates >
< xsl:apply-templates >
语法:
< xsl:apply-templates select="pattern" order-by="sort-criteria-list" >
属性:
select ── 确定在此上下文环境中应执行什么模板,即选取用< xsl:template >标记建立的模板(块)。
order-by ── 以分号(;)分隔的排序标准,通常是子标记的序列
示例:
以个人简历为例,为便于处理我们希望“技能”中每一项都用标记对< skill >< /skill >括起来,有多少项技能就有多少个这种标记对,经过修改后的个人简历XML文档内容如下:
< ?xml version="1.0" encoding="GB2312"? >
< ?xml:stylesheet type="text/xsl" href="resume_template.xsl"? >
< document >
< resume >
< name >禹希初< /name >
< sex >男< /sex >
< birthday >1977.5< /birthday >
< skill >数据库设计与维护< /skill >
< skill >WEB开发< /skill >
< /resume >
< /document >
然后,建立一个新XSL文件resume_template.xsl,采用模板的形式,其内容如下:
< ?xml version="1.0" encoding="GB2312"? >
< xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl" >
< !--根模板-- >
< xsl:template match="/" >
< HTML >< HEAD >< TITLE >个人简历< /TITLE >< /HEAD >
< BODY >
< xsl:apply-templates select="document/resume"/ >
< /BODY >
< /HTML >
< /xsl:template >
< !--简历模板-- >
< xsl:template match="resume" >
< TABLE border="1" cellspacing="0" >
< CAPTION >个人简历(
< xsl:eval >formatIndex(childNumber(this), "I")< /xsl:eval >
)< /CAPTION >
< xsl:apply-templates select="name" / >
< xsl:apply-templates select="sex" / >
< xsl:apply-templates select="birthday" / >
< TR/ >
< TD >技能< /TD >< TD COLSPAN="5" >
< TABLE cellspacing="0" >
< xsl:apply-templates select="skill"/ >
< /TABLE >
< /TD >
< /TABLE >
< BR/ >
< /xsl:template >
< !--姓名模板-- >
< xsl:template match="name" >< TD >姓名< /TD >
< TD >< xsl:value-of/ >< /TD >
< /xsl:template >
< !--性别模板-- >
< xsl:template match="sex" >< TD >性别< /TD >
< TD >< xsl:value-of/ >< /TD >
< /xsl:template >
< !--生日模板-- >
< xsl:template match="birthday" >< TD >生日< /TD >
< TD >< xsl:value-of/ >< /TD >
< /xsl:template >
< !--技能模板-- >
< xsl:template match="skill" >
< TR >< TD >< xsl:value-of/ >< /TD >< /TR >
< /xsl:template >
< /xsl:stylesheet >
保存文件,打开文件(个人简历.xml),效果令人满意吧。其实要做到同样的效果,用前面三周介绍的方法也可做,但你得把它作为一整体考虑。
在上面的XSL文件中,我们将性别、生日、技能等数据项分别用模板来单独写,再用< xsl:apply-template >来调用,这样,即使你日后要对这些模板作相应的修改与扩充也很方便,不致于出现互相干扰、混杂不清的情况。这种从上至下、逐层细化的设计方法,极大地减少工作复杂程度,也大大减少了差错的产生,可以实现多人的协作设计。
注意:
如果XML文档中不同标记有同名的子标记,在为其编写模板时,应把父标记作为其前缀,格式为(parent_mark/child_mark)。
模板文件必须有一个根模板,其属性match是“/”。
XML技术的优势之一就在于数据输出的可选择性,即选择需要的数据输出。前面我们所讲到的选择模式语句:、及只是简单的选取通过”/”符号层层到达的节点,如果我们对XML数据不需要全部输出,而只需要其中的满足某条件的部分数据,“萝卜青菜、各取所需“,那么条件判断与多条件判断及则迎合了这种需要,如果你对程序设计熟悉的话,会觉得它们似曾相识。
XSL中的IF,首先,介绍XSL元素的语法结构:
语法:
属性:
expr ──脚本语言表达式,计算结果为“真”或“假”;如果结果为“真”,且通过test,则在输出中显示其中内容(可省略此项属性)。
language ──expr属性中表达式的脚本语言类型,其取值与HTML标记SCRIPT的LANGUAGE属性的取值相同,缺省为“JScript”test ──源数据测试条件。
示例:
此处以一份报表为例,文件名为report.xml,其内容如下:
甲班
5070
3010
乙班
2030
4050
丙班
7040
2010
我们采用XSL模板结合今天所学的,为其编写一个XSL文档,要求季度产量小于等于20的用红色表示,文件名为report.xsl,内容如下:
1999年生产统计
1999年生产统计
|
|
|
|
|
color:red
说明:
q1|q2|q3|q4 ──标记q1、q2、q3、q3均用此模板确定输出
$le$ ──是关系运算符中的“小于等于”,其它关系有小于($lt$)、大于($gt$)、大于等于($ge$)、等于($eq$)、不等于($ne$)等
. ──表示引用当前标记
[ ] ──表示筛选,只有满足筛选条件的标记才能被选取
value() ──XSL函数,其他常用XSL函数有text()、end()、index()等。
上期我们学习了XSL元素< xsl:if >,已能通过测试XML数据的值来决定不同的输出形式(不知你尝试过没有,实际上< xsl:for-each >也可部分实现< xsl:if >的功能),但有时,我们希望对同一数据同时测试多个条件,根据不同条件输出相应结果。当然,我们可以用if,假如我们只有if可用的话。幸好我们有一个更好的选择,那就是用< xsl:choose >。下面介绍相关元素的语法:
< xsl:choose >
语法:< xsl:choose >
属性:无,表示一个多选测试的开始
< xsl:when >
语法:
< xsl:when expr="script-expression" language="language-name" test="pattern" >
属性:
expr ── 脚本语言表达式,计算结果为“真”或“假”;如果结果为“真”,且通过test,则在输出中显示其中内容(可省略此项属性)。
language ── expr属性中表达式的脚本语言类型,其取值与HTML标记SCRIPT的LANGUAGE属性的取值相同,缺省为“JScript”。
test ── 源数据测试条件。
< xsl:otherwise >
语法:< xsl:otherwise >
属性:无,在一个多选测试中,如果没有不满足< xsl:when >规定的条件,如果在最后有此标记,则输出此标记中的内容。
示例:
此处以学生成绩单为例,要求按成绩的高低给出优秀( >85)、一般(70~85)、起格(60~69)、不及格(< 60),而不是显示分数。其中成绩单的XML文档(文件名:grade.xml)如下:
< ?xml version="1.0" encoding="GB2312"? >
< ?xml:stylesheet type="text/xsl" href="grade.xsl"? >
< document >
< grade >
< name >大胖< /name >< english >80< /english >
< math >90< /math >< chymest >90< /chymest >
< /grade >
< grade >
< name >小花< /name >< english >98< /english >
< math >70< /math >< chymest >85< /chymest >
< /grade >
< /document >
为实现按分数分等级显示,其XSL文档(文件名:grade.xsl)内容如下:
< ?xml version="1.0" encoding="GB2312"? >
< xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl" >
< xsl:template match="/" >
< HTML >
< HEAD >< TITLE >成绩单< /TITLE >< /HEAD >
< BODY >< xsl:apply-templates select="document"/ >< /BODY >
< /HTML >
< /xsl:template >
< xsl:template match="document" >
< TABLE border="1" cellspacing="0" >
< TH >姓名< /TH > < TH >英语< /TH >< TH >数学< /TH >< TH >化学< /TH >
< xsl:apply-templates select="grade"/ >
< /TABLE >
< /xsl:template >
< xsl:template match="grade" >
< TR >
< TD >< xsl:apply-templates select="name"/ >< /TD >
< TD >< xsl:apply-templates select="english"/ >< /TD >
< TD >< xsl:apply-templates select="math"/ >< /TD >
< TD >< xsl:apply-templates select="chymest"/ >< /TD >
< /TR >
< /xsl:template >
< xsl:template match="name" >< xsl:value-of/ >< /xsl:template >
< xsl:template match="english|math|chymest" >
< xsl:choose >
< xsl:when test=".[value() $gt$ 85]" >优秀< /xsl:when >
< xsl:when test=".[value() $gt$ 70]" >一般< /xsl:when >
< xsl:when test=".[value() $gt$ 60]" >起格< /xsl:when >
< xsl:otherwise >不起格< /xsl:otherwise >
< /xsl:choose >
< /xsl:template >
< /xsl:stylesheet >
说明:
在< xsl:choose >选择中,从第一个< xsl:when >开始,逐个测试,直到满足一个测试条件就将其中的内容输出,不再测试后面的条件;如果不满足任何一个条件,则输出< xsl:otherwise >中的内容。
标记对< xsl:when >< /xsl:when >与< xsl:otherwise >< /xsl:otherwise >中可嵌套< xsl:if >或< xsl:choose >。
运算符、关系与逻辑运算符,特殊字符等
今天我们学习XSL的各种运算符,满足编写更大灵活性的XSL样式的要求。
表一、运算符与特殊字符
运算符 描述
/ 选择子元素,返回左侧元素的直接子元素;如果“/”位于最左侧表示选择根结点的直接子元素
// 递归下降,不论深度,搜索指定的元素;如果位于最左侧表示从根结点出发递归下降搜索指定元素
. 表示当前元素
* 通配符,选择任意元素,不考虑名字
@ 取得属性值,作为属性名的前缀
@* 通配符,选择任意属性,不考虑名字
: 名字作用范围分隔符,将名字作用范围前缀与元素或属性名分隔开来
!* 在相关节点上应用指定方法
( )* 分组,明确指定优先顺序
[ ] 应用过滤样式
[ ]* 下标运算符,用于在集合中指示元素
表二、逻辑运算符
比较运算符 可选方式 描述
and $and$或&& 逻辑与
or $or$或|| 逻辑或
not() $not$ 逻辑非
表三、关系运算符
= $eq$ 相等
= $ieq$ 相等(不区分大小写)
!= $ne$ 不等
$ine$ 不等(不区分大小写)
< $lt$ 小于
$ilt$ 小于(不区分大小写)
<= $le$ 小于等于
$ile$ 小于等于(不区分大小写)
> $gt$ 大于
$igt$ 大于(不区分大小写)
>= $ge$ 大于等于
$ige$ 大于等于(不区分大小写)
$all$ 集合运算符,如果集合中所有项目均满足条件则返回“真”
$any$ 集合运算符,如果集合中任意项目满足条件则返回“真”
| 集合运算符,返回两个集合的联合
示例一:
从个人简历中寻找具有具有“WEB开发”技能的人的姓名与E-Mail。假设文档结构如下所示:
< document >
< resume >
< name >name< /name >
< sex >sex< /sex >
< birthday >birthday< /birthday >
< skill >skill1< /skill >
< skill >skill2< /skill2 >
…
< skill >skilln< /skill >
< /resume >
< resume >
…
< /resume >
…
< /document >
为从以上结构的个人简历中寻找出所有具有“WEB开发”技能的人的姓名与E-Mail的XSL文档结构如下:
< TABLE border="1" cellspacing="0" >
< TH >姓名< /TH >< TH >E-Mail< /TH >
< xsl:for-each select="resume [ $any$ skill='WEB开发' ]" >
< TR >< TD >< xsl:value-of select="name"/ >< /TD >
< TD >< xsl:value-of select="E-Mail"/ >< /TD >
< /TR >
< /xsl:for-each >
< /TABLE >
说明:
1.[ ] ───表示选择条件,只有满足条件的个人简历才被显示;
2.$any$ ──由于每个人有多种技能,故加$any$作为前缀,以使每个人所有技能都能被比较;
3.skill='WEB开发' ──筛选条件
示例二、
仍上面的XML文档为例,如果欲选择1977/1/1之前出生的人的姓名、技能与E-Mail,相应的XSL文档结构如下(假定生日格式为yyyy/mm/dd):
< TABLE border="1" cellspacing="0" >
< TH >姓名< /TH >< TH >技能< /TH >< TH >E-Mail< /TH >
< xsl:for-each select="resume [ birthday $lt$ '1977/1/1' ]" >
< TR >
< TD >< xsl:value-of select="name"/ >< /TD >
< TD >< xsl:value-of select="skill [0]"/ >
< xsl:for-each select="skill [index() >0]" >、
< xsl:value-of select="."/ >
< /xsl:for-each >
< /TD >
< TD >< xsl:value-of select="E-Mail"/ >< /TD >
< /TR >
< /xsl:for-each >
< /TABLE >
说明:
1. birthday $lt$ '1977/1/1' ── 搜索条件,在此处使用“< ”会错误,故使用“$lt$”表示小于。
2. skill [0] ─── 表示选择skill的第一项
3. skill [index() >0]───表示选择skill的第二项以后(包括第二项)的项目
4. xsl:value-of select="." ─── 表示选择当前标记的值
相信大家应该注意到,在前面以及本次的例子中出现了一些函数,如index()、formatIndex()、childNumber(),也许大家还不完全明了其中的含义吧?敬请关注下一课。
注:如果拷贝源代码,请将空格删除
本期学习XSL样式方法,即可用于XSL元素< xsl:for-each >、< xsl:value-of >、< xsl:template >的select属性、< xsl:apply-templates >的match属性、< xsl:if >、< xsl:when >的test属性中,对元素的范围进行筛选,从而提供更大的灵活性。
XML与DHTML(动态HTML)一样,这些节点都是一个个对象,而且这些对象都是有层次的,从根节点开始构成一颗层次清淅的树状结构,这就形成了文档对象模型DOM,通过对象的属性、方法来达到访问控制XML节点的目的。
我们这里不打算就XML的DOM逐一详细阐述,因为这完全可以写成一个篇幅较多的教程,我们先就一些常见的方法作一些讨论,以期对DOM的对象方法有一个大致的了解。
注:从本期开始,所有示例不再提供完整源代码,如有不明白之处,请仔细阅读前面七期、并动手练手。
一、end()
含义:返回集合中最后一个元素。
示例:输出最后一份简历
假定XML文件格式为:
……< resume >…< /resume >……< resume >…< /resume >……
相应XSL文件内容为:
< xsl:for-each select="resume[end()]" >……< /xsl:for-each >
或
< xsl:templates match="resume[end()]" >……< /xsl:templates >
或
< xsl:apply-template select="resume[end()]" >……< /xsl:apply-template >
二、index()
含义:返回该元素在集合中的位置,返回值是一整数,其中第一个元素返回0
示例:返回前面三份简历
resume[index() $le$ 3]
注意:index()是与父元素相关的,请看下例:
< x >
< y/ >
< y/ >
< /x >
< x >
< y/ >
< y/ >
< /x >
返回所有< x >中的第一个< y >
x/y[index()=0] 或x/y[0]
三、nodeName()
含义:返回元素的名字,即标记名
示例:选择任意元素,假如其名字(即标记名)等于“name”
*[nodeName()='name'] 或 *[name]
四、number()
含义:将值转换为数值形式,如果不是数值则返回空,要求参数
示例:年龄(age)小于30岁的人的简历(resume)
resume[number(age) $lt$ 30] 或resume[age $lt$ 30]
五、nodeType()
含义:返回结点类型,结果为是数值。以下是返回值列表:
结点类型 结点类型值 结点的字符形式描述
Element 1 'element'
Element Attribute 2 'attribute'
Markup-Delimited Region of Text 3 'text'
Processing Instruction 7 'processing_instruction'
Comment 8 'comment'
Document Entity 9 'document'
六、value()
含义:返回元素或属性的值
示例:value()是元素或属性的缺省方法,以下表示是等价
name!value()="NAME"与name="NAME"
@attr="attribute_value"与@attr="attribute_value"
注:@是属性前缀,@attr表示是属性attr
七、attribute()
含义:返回所有属性结点的集合,等价于“@*”
示例:寻找所有的resume元素,满足条件至少有一个属性的值为“ABC”
resume[$any$ attribute()='ABC']或resume[$any$ @*='ABC']
寻找所有的resume元素,满足条件至少有一个子元素有一个属性的值为“ABC”
resume[$any$ */attribute()='ABC']或resume[$any$ */@*='ABC']
八、comment()
含义:返回所有注释结点
示例:例如
resume[$any$ comment()='禹希初的简历']
表示寻找含有注释语句
< !--禹希初的简历-- >
的元素< resume >
九、cdata()
含义:返回所有CDATA类型的结点的集合
示例:例如
resume[$any$ cdata()='禹希初的简历']
表示寻找含有下述语句(必须是直接子结点)
< ![CDATA[禹希初的简历]] >
的元素< resume >
十、node()
含义:返回当前上下文环境中除根结点和属性结点以外的所有结点的集合,等价于
“* | pi() | comment() | text()”
示例:寻找所有元素resume,其最后一个结点的名字为"skill"
resume[node()[end()]!nodeName()='skill']
寻找所有resume元素的第一个结点:resume/node()[0]
十一、textnode()
含义:返回所有文本类型的结点的集合
示例:寻找每一个p元素的第二个文本结点
p/textnode(1)或p!textnode(1)
十二、text()
含义:返回所有表示文本字符串的结点的集合,等价于"cdata()|textnode()";
本期的内容就介绍至此,另有一个函数date()在本人的机器上一试就发生错误使浏览器自动关闭,还有一个函数pi()本人尚未找到适当的应用方法,就不介绍了,下期将讲述如何XSL中使用脚本。
脚本与XSL的结合及应用
有时,我们可能会希望XML文档输出时能对其中内容加上一些统计信息或者如编号什么的,利用前面的知识就不太容易实现了。今天将介绍两个新元素< xsl:eval >与< xsl:script >,使我们能轻松处理这个难题。
< xsl:eval >
含义:
计算脚本表达式,输出一个文本字符串
语法:
< xsl:eval language="language-name" >
属性:
language ── 规定所用脚本语言的名字,可用的属性有“JavaScript”、“JScript”、“VBScript”、“VBS”等,缺省为“JScript”。
< xsl:script >
含义:
声明全局变量或定义函数。
语法:
< xsl:script language="language-name" >
属性:
同< xsl:eval >
示例:
不知大家对于第四期《跟我学XML》中的例子是否还有印象?其中的XML文档并没有对简历编号,但输出中却加上了大写的罗马数字序号。今天将再举一稍为复杂一些的例子:
假如我们编写一份年终生产统计表,其中需要小计一项,常规的作法是事先将其算出来,现在不必了,我们可以只给出单项统计,显示时再统计小计一项。请找出《跟我学XML》的第五期,XML文件不必修改,对XSL文件的修改如下:
……
< xsl:template match="document" >
……
< xsl:apply-templates select="report"/ >
< TR >< TD >小计< /TD >
< TD >< xsl:eval >total(this,"q1")< /xsl:eval >< /TD >
< TD >< xsl:eval >total(this,"q2")< /xsl:eval >< /TD >
< TD >< xsl:eval >total(this,"q3")< /xsl:eval >< /TD >
< TD >< xsl:eval >total(this,"q4")< /xsl:eval >< /TD >
< /TR >
< /TABLE >
< xsl:script >
function total(node,q){
temp=0;
mark='/document/report/'+q;
v=node.selectNodes(mark);
for(t=v.nextNode();t;t=v.nextNode()){
temp+=Number(t.text);
}
return temp; //小计值
}
< /xsl:script >
< /xsl:template >
说明:
黑体部分为添加部分,注意添加部分分为两部分,< xsl:script >< /xsl:script >必须置于< /TABLE >之后,切记。
selectNodes() ── 是XMLDOMObject的一个方法,返回文档中所有满足条件的结点的集合,条件与< xsl:for-each >和select属性的取值采用同样的写法,可以加筛选、下标等限制,如:
寻找一季度产量大于等于50的班组
/document/report/q1[value() $ge$ 50]
以上写法还有一个更简单的写法
//q1[value() $ge$ 50]
//表示从根结点出发遍历所有结点,寻找满足条件的结点,如果文档内有同名但意义不同的结点则不能用此种方法,非不得已不建议使用。以此为例,如果希望统计年总产量,则可以下述字符串寻找结点(建议使用最后一种,此种描述将精确找到需要汇总的数据)
//*[value() $gt$ 0]
或
//(q1|q2|q3|q4)
或
/document/report/(q1|q2|q3|q4)
nextNode() ── 返回结点集中的下一个结点
Number() ── 将提供的参数转换为数值
XSL函数二----DOM中对象的方法
本期介绍多个XSL对于VBScript、JScript增加的方法、属性,以充分发挥XML的优势,用于< xsl:script >、< xsl:eval >标记内表达式的编写或< xsl:if >、< xsl:when >的expr属性。
一、absoluteChildNumber
含义:返回结点相对于它所有的兄弟(不论名字是否相同)的序号
语法:absoluteChildNumber(node)
参数:node ── 对象,欲返回编号的结点。
示例:
1、假定文档结构为:< document >< head/ >< body/ >< /document >,其中document为顶层结点,下述表达式将输出
< xsl:eval >
absoluteChildNumber(this.selectNodes('/document/body').item(0))
< /xsl:eval >
2、确定当前结点相对于其所有兄弟的序号
< xsl:eval >absoluteChildNumber(this)< /xsl:eval >
二、ancestorChildNumber
含义:从给定结点出发根据给定祖先结点名返回最近的祖先结点的序号(相对于同名结点)。如果找不祖先,则返回0。
语法:ancestorChildNumber(bstrNodeName, pNode)
参数:
bstrNodeName ── 字符串。被搜索的祖先结点的名字。
pNode ── 对象。搜索开始位置的结点。
示例:
查找当前结点最近的名为report祖先结点。
ancestorChildNumber('report',this)
三、attributes
含义:返回结点属性的集合
语法:object.attributes
参数:object ── 结点对象
示例:
当前结点属性的个数
this.attributes.length
当前结点第三个属性的值
this.attributs.item(2).value
或this.attributes.item(2).text
或this.attributes(2).text
注意:如果给定的下标大于属性总和减1将出错,第一个属性的下标是0。
四、baseName
含义:返回有名字空间限制的基本名,即不包括名字前缀
语法:object.baseName
参数:object ── 结点对象
示例:当前结点的基本名:this.baseName
五、childNumber
含义:返回结点相对于同名同胞的序号
语法:childNumber(object)
参数:object ── 结点对象
示例:假定XML文档结构如下
< x >< y >< z >< z/ >< y/ >< /x >
如果当前结点是z ,则childNumber(this)返回1,而absoluteChildNumber(this)返回3。
六、dataType
含义:设定或读取结点的数据类型
语法:设定结点的数据类型 object.dataType=objValue
读取结点的数据类型 objValue=object.dataType
参数:object ── 结点对象
示例:读取当前结点的数据类型
dtType=this.dataType
七、depth
含义:指定结点出现在文档树上的深度,即该结点位于文档第几层,顶层结点位于
第一层,根结点(即用“/”表示的结点)位于第0层
语法:depth(pNode)
参数:pNode ── 结点对象
示例:当前结点的深度
depth(this)
八、firstChild、lastChild
含义:返回结点的第一个子结点(或最后一个子结点)。
语法:pNode.firstChild
pNode.lastChild
参数:pNode ── 结点对象
示例:当前结点的第一个结点的名字
this.firstChild.nodeName
九、formatIndex
含义:用指定的计数系统格式化提供的整数。
语法:formatIndex(lIndex, bstrFormat)
参数:
lIndex ── 整型数值或变量
bstrFormat ── 数据格式,可选值有a、A、i、I、1、01(以0打头的数值形式,如果要求固定长度的编号如0001、0002则非常有用)
示例:当前结点的大写罗马数字编号
formatIndex(childNumber(this),'I')
十、formatNumber
含义:以指定格式输出数值。
语法:formatNumber(dblNumber, bstrFormat)
参数:说明同formatNumber,不同之处在于格式化的可以是小数
示例:对变量a的值格式化为两位小数 formatNumber(a,'#.00')
十一、hasChildNodes
含义:如果结点有子结点则返回true(-1),否则为false(0)
语法:pNode.hasChildNodes()
注意:与此前介绍的函数不同,此函数后必须带一个空括号
示例:判断当前结点是否有子结点
this.hasChildNodes
十二、namespaceURI、prefix
含义:返回结点名字空间的全局资源标识符(或前缀)
语法:pNode.namespaceURI
pNode.prifix
十三、nextSibling、previousSibling、parentNode
含义:返回结点的下一个兄弟(或前一个兄弟、或结点的父结点)
语法:pNode.nextSibling
pNode.previousSibling
pNode.parentNode
注意:对根结点(即“/”)应用parentNode方法、对第一个孩子结点应用previousSibling方法、对最后一个孩子结点应用nextSibling方法均会导致错误,可通过此过关系运算符==(等于)和!=(不等于)来判断一个结点是否某一指定结点,格式为pNode1 = pNode2或pNode2 != pNode2。
十四、nodeName
含义:返回元素、属性、入口的名字或其他类型结点的一个特定字符串
语法:pNode.nodeName
示例:当前结点的名字
this.nodeName
十五、nodeType、NodeTypeString
含义:返回结点的类型的数值形式(或字符串形式)
语法:pNode.nodeType或pNode.nodeTypeString
返回值:
结点类型 结点类型编号 结点类型字符串
元素 1 'element'
元素属性 2 'attribute'
Markup-Delimited Region of Text 3 'text'
Processing Instruction 7 'processing_instruction'
Comment 8 'comment'
Document Entity 9 'document'
十六、nodeTypedValue
含义:以结点预定义的数据类型返回结点的值
语法:pNode.nodeTypedValue
示例:假定当前结点的数据类型是fixed.14.4,下例将以数值返回结点的值,而不是文本一个字符串
this.nodeTypedValue
十七、nodeValue
含义:返回结点的文本
语法:pNode.nodeValue
注意:该方法不用于元素类结点,可用于属性、CDATA、注释、文本等结点
示例:当前元素第一个属性的值
this.attributes(0).nodeValue
当前元素内的文本(假定该元素内只有文本,无其它元素,即< mark >text< /mark >,建议多尝几次掌握其确切的用法)
this.firstChild.nodeValue
十八、ownerDocument
含义:返回包含该结点的文档的根
语法:pNode.ownerDocument
注意:该方法用于文档的根结点将出错
十九、selectNodes
含义:给定的样式匹配应用于当前结点并返回匹配的结点集合
语法:pNode.selectNodes('pattern')
提示:pattern的编写与< xsl:for-each >的select属性的值类似,其中以“/”开头表示
从文档的根出发搜索;以“//”开头表遍历文档的所有结点;以“..”开头
表示从当前结点的父结点开始;如果欲从当前结点向下搜索则不能有以上特殊字符打头。
示例:与当前结点同名的元素在其父元素内的个数
childNumber(this.selectNodes("../"+this.nodeName+"[end()]").item(0))
当前元素内名字为“skill”的元素的个数
childNumber(this.selectNodes("skill[end()]").item(0))
二十、selectSingleNode
含义:与selectNodes类似,不同的只返回匹配的第一个结点、而不是结点集合
语法:pNode.selectSingleNode('pattern')
示例:与当前结点同名的元素在其父元素内的个数
childNumber(this.selectSingleNode("../"+this.nodeName+"[end()]"))
当前元素内名字为“skill”的元素的个数
childNumber(this.selectSingleNode("skill[end()]"))
二十一、text
含义:返回结点与它的子树内的文字内容
语法:pNode.text
示例:整个文档内的文字内容
this.ownerDocument.text
当前元素及其子树的文字内容
this.text
二十二、xml
含义:返回结点及其后代的XML表示
语法:pNode.xml
示例:当前文档的XML内容
this.ownerDocument.xml
另有几个函数不作介绍,列于其下以供参考,如感兴趣,请访问http://msdn.microsoft.com获取详细说明。
formatTime(varTime, bstrFormat,varDestLocale)
formatDate(varDate, bstrFormat,varDestLocale)
apendChild(newChild)
definition
CloneNode
insertBefore(newChild, refChild)
parsed
removeChild(oldChild)
replaceChild(newChild, oldChild)
specified
transformNode(stylesheet)
transformNodeToObject(stylesheet,outputObject)
uniqueID(pNode)
|