黑色海岸线论坛 - Powered by Discuz! Board

标题: 跟我学XML [打印本页]

作者: bigblock 时间: 2003-12-13 19:45 标题: 跟我学XML

[这个贴子最后由bigblock在 2003/12/14 05:57pm 第 1 次编辑] 第一个XML文档　　随着Internet的发展，越来越多的信息进入互联网，信息的交换、检索、保存及再利用等迫切的需求使HTML这种最常用的标记语言已越来越捉襟见肘。HTML将数据内容与表现融为一体，可修改性、数据可检索性差，而XML借鉴了HTML与数据库、程序语言的优点，将内容与表现分开，不仅使检索更为方便，更主要的是用户之间数据的交换更加方便，可重用性更强。 XML是一种元标记语言，没有许多固定的标记，为WEB开发人员提供了更大的灵活性。当我们使用HTML时，标记只是简单的表示内容的显示形式，而与表示的内容没有任何关联，为文档的进一步处理带来极大的不便。比如要表示个人简历，用HTML的表示方式如下： < HTML > < BODY > < TABLE border=1 cellspacing=0 > < TH >姓名< TD >禹希初< TH >性别< TD >男< TH >生日< TD >1977.5 < TR > < TH >技能< TD colspan=5 >数据库设计与维护、WEB开发 < /TABLE > < /BODY > < /HTML > 　　在这里，我们无法从标记TH、TD得知其内容表示什么，如果用XML，相应的文档（文件名：个人简历.xml）就可写成如下形式： < ?xml version="1.0" encoding="GB2312"? > < resume > < name >禹希初< /name > < sex >男< /sex > < birthday >1977.5< /birthday > < skill >数据库设计与维护、WEB开发< /skill > < /resume > 说明：　　version──规定了XML文档的版本，此处只能是1.0；　　encoding── 此处规定了XML文档的编码类型，此处取值为“GB2312”，也就是“简体中文”。　　对比两例，使用XML我们可以做到自定义标记，用标记表明内容的含义。这样在Internet上交流资料时，为用计算机处理文档提供了极大的方便，同时我们阅读源文件时也不会被一大堆格式弄得晕头转向。　　然而，由于XML并没有为标记规定显示方式，如果我们在游览器中查看以上两个文档（建议使用IE5.0或更新版本），我们将看到xml文档并没有以诸如表格的方式来显示。难道我们就不能像HTML一样显示文档吗？回答是否定的。以个人简历为例，需要另建一个格式文件说明各个标记的显示方式，其内容如下（假设文件名为resume.css）： resume{ display: block;} name{ display: block; font-size:120%;} sex{ display:block; text-indent:2em} birthday{ display:block; text-indent:2em} skill{ display:block; text-indent:2em} 说明：　　以上均为CSS样式，建议读者参考有关资料熟悉CSS，在以后学习中必须用到，此处由于篇幅关系不作介绍。建立文件resume.css后，在个人简历.xml文件的第一行后添加以下文字： < ?xml:stylesheet type="text/css" href="resume.css"? > 说明：　　此处表示引用一个外部CSS样式文件，其中type规定样式类型（可取值为text/css或text/xsl），href规定文件路径。　　保存文件，再以IE5.0打开文件。怎么样？格式有些不一样吧。好象还不令人满意，文档内容是清晰了，但显示效果比HTML编写的文档就差得多了，XML编写的文档就只能以这种方式显示吗？！提示：　　1. 为了更好的理解与掌握XML，建议大家熟悉HTML 4.0与CSS 2.0语法；掌握JavaScript、VBscript中至少一种；编程经验、对数据库理论与SQL的了解均能使大家在学习XML时获益。　　2. XML文档中标记必须成对出现，如果是空标记也必须有前加“/”的同名标记结束，或使用此种文式< xml_mark/ >表示空标记。　　3. XML以及下周将要介绍的XSL文档，属性值必须用双引号（"）或单引号（'）括起来。　　4. XML文档必须是好结构的（XSL文档也是XML文档中一种），也就是说标记必须有结束标记、标记可以嵌套但不可交叉，如 < outer >< inner >< /inner >< inner/ >< /outer > 是合法的，而下面的形式 < outer >< inner >< /outer >< /inner > 则是错误的。如果XML文档在浏览时出错，多半是违反了上面提到的规则。 XSL入门　　上期我们讲到用CSS（层叠样式表）来格式化XML文档，其效果并不很令人满意。实际上CSS用来格式化HTML标记比较合适些，只是因为它简单才在上例中采用。　　XML在更多的时候只是一种数据文件，怎样将它变为我们日常所看到的HTML格式那样的文件呢？如果我们将XML文件比作结构化的原料的话，那么XSL就好比“筛子“与“模子“，筛子选取自己需要的原料，这些原料再通过模子形成最终的产品：HTML。　　这个模子大致是这样：我们先设计好表现的页面，再将其中需要从XML中获取数据来填充内容的部分“挖掉“，然后用XSL语句从XML中筛出相关的数据来填充。一言以譬之：这XSL实际上就是HTML的一个“壳子“，XML数据利用这个“壳“来生成“传统“的HTML。　　XML在展开时是一个树形结构，我们将树形结构中自定义标记称为节点，节点之间存在父子、兄弟关系，我们要访问其中的结点从根结点就要以”／”来层层进入。　　在XSL这个壳中，我们要从原料库？？XML里提取相关的数据，就要用到XSL提供的模式化查询语言。所谓模式化查询语言，就是通过相关的模式匹配规则表达式从XML里提取数据的特定语句，即我们上所说的“筛子“。参考微软的”XSL开发者指南”，我们大致可将模式语言分为三种：选择模式 < xsl:for-each >、< xsl:value-of >,和 < xsl:apply-templates > 测试模式 < xsl:if > 和< xsl:when > 匹配模式 < xsl:template > 我们现在就分别对之进行介绍。一、选择模式　　选择模式语句将数据从XML中提取出来，是一种简单获得数据的方法，这几个标记都有一个select属性，选取XML中特定的结点名的数据。 1、< xsl:for-each > 如在XML中有这样的数据: < author > < name >小禹< /name > < name >春华< /name > < name >秋实< /name > < /author > 　　我们要读取这三个作者名字，是一个一个地按”author/name”方法来读取吗，可有多个这样的name呀？如果有一种程序性的语句来循环读取有多好啊！　　想得很对，XSL提供了这样的具有程序语言性质的语句< XSL:for-each > 　　用它读取这三个作者名字的方法如下: < xsl:for-each select=”author/name” > ……. < ./xsl:for-each > select，顾名思义：选取，它可以选定XML中特定唯一的标记，也可以选择某一类相同的标记，我们称之为结点集。语法： < xsl:for-each select="pattern" order-by="sort-criteria-list"> 属性： 1. select 　　根据XSL样式查询考察上下文以决定哪类结点集（满足select条件）使用此样式描述。作为一种简化的表示就是，如果你想对文档中的某一种标记的内容的显示方式进行格式化，就可以将让select等于此元素的标记名。例如欲对标记xml_mark进行格式化，即可用如下方式表示： < xsl:for-each select="xml_mark" > < !--样式定义-- > < /xsl:for-each > 2. order-by 　　以分号（;）分隔、作为排序标准的列表。在列表元素前添加加号（+）表示按此标记的内容以升序排序，添加减号（-）表示逆序排序。作为一种简化的表示就是，排序标准列表就是由select规定的标记的子标记的序列，每个标记之间以（;）分隔。 2、< xsl:value-of > < xsl:for-each >模式只是选取节点，并没有取出节点的值，好比猴子只是爬到了树的某个枝干上，那么就用< xsl:value-of >来摘“胜利果实“吧！语法： < xsl:value-of select="pattern" >提取节点的值属性： select用来与当前上下文匹配的XSL式样。简单的讲，如果要在XSL文档某处插入某个XML标记（假定是xml_mark标记）的内容，可用如下方式表示： < xsl:value-of select="xml_mark" >< /xsl:value-of > 或 < xsl:value-of select="xml_mark"/ > 示例：　　此处仍以上期的个人简历的作为例子，我们需要对文件（个人简历.xml）作一定修改，确切的说是将其中的第二行 < ?xml:stylesheet type="text/css" href="resume.css"? > 修改为 < ?xml:stylesheet type="text/xsl" href="resume.xsl"? > 然后建立一个新文件：resume.xsl，其内容如下： < ?xml version="1.0" encoding="GB2312"? > < HTML xmlns:xsl="http://www.w3.org/TR/WD-xsl" > < HEAD > < TITLE >个人简历< /TITLE > < /HEAD >< BODY > < xsl:for-each select="resume" > < P/ > < TABLE border="1" cellspacing="0" > < CAPTION style="font-size: 150%; font-weight: bold" > 个人简历 < /CAPTION > < TR > < TH >姓名< /TH >< TD >< xsl:value-of select="name"/ >< /TD > < TH >性别< /TH >< TD >< xsl:value-of select="sex"/ >< /TD > < TH >生日< /TH >< TD >< xsl:value-of select="birthday"/ >< /TD > < /TR > < TR > < TH >技能< /TH >< TD colspan="5" >< xsl:value-of select="skill"/ >< /TD > < /TR > < /TABLE > < /xsl:for-each > < /BODY > < /HTML > 　　完成这些以后再来让我们看一下辛勤劳动的成果，怎么样？效果不错吧。更酷还在后头呢。现在我们对文件（个人简历.xml）作进一步的修改： 1. 在标记< resume >前添加一个新标记< document >； 2. 将标记对< resume >< /resume >之间的内容（包括这一对标记）复制并粘贴在其后，并在最后用< document >结束。 3. 以Notepad.exe打开文件resume.xsl，在标记< HTML >之后添加文字：< xsl:for-each select="document" >；在标记< /HTML >之前添加文字：< /xsl:for-each >，保存文件。 4. 在浏览器中打开文件（个人简历.xml）。看到了什么？两份个人简历！　　就这样，利用XML我们可以编写内容与样式完成分离的文档！当然，XSL文件比一般的HTML文件要复杂一些，然而一旦完成则可用于格式化所有同类的XML文档。 XSL模板与匹配模式　　经过前几日的学习，我们学习了XHTML文档的编写和以及三个XSL元素，已能编写相当灵活的XSL文档，今天将学习的是XSL模板的编写。我们都知道，短的文档、程序十分好读，但当规模增大后，其复杂性也以更快的速度增加。　　前面我们学了< xsl:for-each >、< xsl:value-of >等，可以用它们对XML数据实现简单的格式化输出，但如果遇到比较复杂的XML格式输出，将XSL按照要求依次写下来的话，一是设计困难，可扩展性差，不利于人员之间的分工协作；另则，可修改性很差，可能会出现牵一发而动全军的情况，不利于维护。程序中模块化设计逐步细化的方法在这里得到了应用！　　XSL模板将XSL的设计细化成一个个模板（块），最后再将这些模板（块）组合成一个完整的XSL；好比船与集装箱，我们不是将所有的货物一件件地堆起来，而是装在各自的集装箱中，然后再在船上将这些集装箱堆放起来。这种方法可以使你先从整体上考虑整个XSL的设计，然后将一些表现形式细化成不同的模块，再具体设计这些模块，最后将它们整合在一起，这样，将宏观与微观结合起来，符合人们条理化、规范化要求。装集装箱？？书写模板（块）：< xsl:template > < xsl:template > 语法： < xsl:template match="node-context" language="language-name" > 属性： match ── 确定什么样的情况下执行此模板。作为一种简化的说明，在此处使用标记的名字；其中最上层模板必须将match设为“/” language ── 确定在此模板中执行什么脚本语言，其取值与HTML中的SCRIPT标记的LANGUAGE属性的取值相同，缺省值是Jscript < xsl:template >用match属性从XML选取满足条件的节点，征对这些特定的节点形成一个特定输出形式的模板。吊集装箱上船-？？调用模板（块）：< xsl:apply-templates > < xsl:apply-templates > 语法： < xsl:apply-templates select="pattern" order-by="sort-criteria-list" > 属性： select ── 确定在此上下文环境中应执行什么模板，即选取用< xsl:template >标记建立的模板（块）。 order-by ── 以分号（;）分隔的排序标准，通常是子标记的序列示例：　　以个人简历为例，为便于处理我们希望“技能”中每一项都用标记对< skill >< /skill >括起来，有多少项技能就有多少个这种标记对，经过修改后的个人简历XML文档内容如下： < ?xml version="1.0" encoding="GB2312"? > < ?xml:stylesheet type="text/xsl" href="resume_template.xsl"? > < document > < resume > < name >禹希初< /name > < sex >男< /sex > < birthday >1977.5< /birthday > < skill >数据库设计与维护< /skill > < skill >WEB开发< /skill > < /resume > < /document > 　　然后，建立一个新XSL文件resume_template.xsl，采用模板的形式，其内容如下： < ?xml version="1.0" encoding="GB2312"? > < xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl" > < !--根模板-- > < xsl:template match="/" > < HTML >< HEAD >< TITLE >个人简历< /TITLE >< /HEAD > < BODY > < xsl:apply-templates select="document/resume"/ > < /BODY > < /HTML > < /xsl:template > < !--简历模板-- > < xsl:template match="resume" > < TABLE border="1" cellspacing="0" > < CAPTION >个人简历（ < xsl:eval >formatIndex(childNumber(this), "I")< /xsl:eval > ）< /CAPTION > < xsl:apply-templates select="name" / > < xsl:apply-templates select="sex" / > < xsl:apply-templates select="birthday" / > < TR/ > < TD >技能< /TD >< TD COLSPAN="5" > < TABLE cellspacing="0" > < xsl:apply-templates select="skill"/ > < /TABLE > < /TD > < /TABLE > < BR/ > < /xsl:template > < !--姓名模板-- > < xsl:template match="name" >< TD >姓名< /TD > < TD >< xsl:value-of/ >< /TD > < /xsl:template > < !--性别模板-- > < xsl:template match="sex" >< TD >性别< /TD > < TD >< xsl:value-of/ >< /TD > < /xsl:template > < !--生日模板-- > < xsl:template match="birthday" >< TD >生日< /TD > < TD >< xsl:value-of/ >< /TD > < /xsl:template > < !--技能模板-- > < xsl:template match="skill" > < TR >< TD >< xsl:value-of/ >< /TD >< /TR > < /xsl:template > < /xsl:stylesheet > 　　保存文件，打开文件（个人简历.xml），效果令人满意吧。其实要做到同样的效果，用前面三周介绍的方法也可做，但你得把它作为一整体考虑。　　在上面的XSL文件中，我们将性别、生日、技能等数据项分别用模板来单独写，再用< xsl:apply-template >来调用，这样，即使你日后要对这些模板作相应的修改与扩充也很方便，不致于出现互相干扰、混杂不清的情况。这种从上至下、逐层细化的设计方法，极大地减少工作复杂程度，也大大减少了差错的产生，可以实现多人的协作设计。注意：　　如果XML文档中不同标记有同名的子标记，在为其编写模板时，应把父标记作为其前缀，格式为（parent_mark/child_mark）。　　模板文件必须有一个根模板，其属性match是“/”。　　XML技术的优势之一就在于数据输出的可选择性，即选择需要的数据输出。前面我们所讲到的选择模式语句:、及只是简单的选取通过”/”符号层层到达的节点，如果我们对XML数据不需要全部输出，而只需要其中的满足某条件的部分数据，“萝卜青菜、各取所需“，那么条件判断与多条件判断及则迎合了这种需要，如果你对程序设计熟悉的话，会觉得它们似曾相识。　　XSL中的IF，首先，介绍XSL元素的语法结构：语法：属性：　　expr ──脚本语言表达式，计算结果为“真”或“假”；如果结果为“真”，且通过test，则在输出中显示其中内容（可省略此项属性）。　　language ──expr属性中表达式的脚本语言类型，其取值与HTML标记SCRIPT的LANGUAGE属性的取值相同，缺省为“JScript”test ──源数据测试条件。示例：此处以一份报表为例，文件名为report.xml，其内容如下：甲班 5070 3010 乙班 2030 4050 丙班 7040 2010 　　我们采用XSL模板结合今天所学的，为其编写一个XSL文档，要求季度产量小于等于20的用红色表示，文件名为report.xsl，内容如下： 1999年生产统计

1999年生产统计

班组一季度二季度三季度四季度

color:red

说明： q1|q2|q3|q4 ──标记q1、q2、q3、q3均用此模板确定输出 $le$ ──是关系运算符中的“小于等于”，其它关系有小于（$lt$）、大于（$gt$）、大于等于（$ge$）、等于（$eq$）、不等于（$ne$）等 . ──表示引用当前标记 [ ] ──表示筛选，只有满足筛选条件的标记才能被选取 value() ──XSL函数，其他常用XSL函数有text()、end()、index()等。　　上期我们学习了XSL元素< xsl:if >，已能通过测试XML数据的值来决定不同的输出形式（不知你尝试过没有，实际上< xsl:for-each >也可部分实现< xsl:if >的功能），但有时，我们希望对同一数据同时测试多个条件，根据不同条件输出相应结果。当然，我们可以用if，假如我们只有if可用的话。幸好我们有一个更好的选择，那就是用< xsl:choose >。下面介绍相关元素的语法： < xsl:choose > 语法：< xsl:choose > 属性：无，表示一个多选测试的开始 < xsl:when > 语法： < xsl:when expr="script-expression" language="language-name" test="pattern" > 属性： expr ── 脚本语言表达式，计算结果为“真”或“假”；如果结果为“真”，且通过test，则在输出中显示其中内容（可省略此项属性）。 language ── expr属性中表达式的脚本语言类型，其取值与HTML标记SCRIPT的LANGUAGE属性的取值相同，缺省为“JScript”。 test ── 源数据测试条件。 < xsl:otherwise > 语法：< xsl:otherwise > 属性：无，在一个多选测试中，如果没有不满足< xsl:when >规定的条件，如果在最后有此标记，则输出此标记中的内容。示例：　　此处以学生成绩单为例，要求按成绩的高低给出优秀（ >85）、一般（70~85）、起格（60~69）、不及格（< 60），而不是显示分数。其中成绩单的XML文档(文件名：grade.xml)如下： < ?xml version="1.0" encoding="GB2312"? > < ?xml:stylesheet type="text/xsl" href="grade.xsl"? > < document > < grade > < name >大胖< /name >< english >80< /english > < math >90< /math >< chymest >90< /chymest > < /grade > < grade > < name >小花< /name >< english >98< /english > < math >70< /math >< chymest >85< /chymest > < /grade > < /document > 　　为实现按分数分等级显示，其XSL文档（文件名：grade.xsl）内容如下： < ?xml version="1.0" encoding="GB2312"? > < xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl" > < xsl:template match="/" > < HTML > < HEAD >< TITLE >成绩单< /TITLE >< /HEAD > < BODY >< xsl:apply-templates select="document"/ >< /BODY > < /HTML > < /xsl:template > < xsl:template match="document" > < TABLE border="1" cellspacing="0" > < TH >姓名< /TH > < TH >英语< /TH >< TH >数学< /TH >< TH >化学< /TH > < xsl:apply-templates select="grade"/ > < /TABLE > < /xsl:template > < xsl:template match="grade" > < TR > < TD >< xsl:apply-templates select="name"/ >< /TD > < TD >< xsl:apply-templates select="english"/ >< /TD > < TD >< xsl:apply-templates select="math"/ >< /TD > < TD >< xsl:apply-templates select="chymest"/ >< /TD > < /TR > < /xsl:template > < xsl:template match="name" >< xsl:value-of/ >< /xsl:template > < xsl:template match="english|math|chymest" > < xsl:choose > < xsl:when test=".[value() $gt$ 85]" >优秀< /xsl:when > < xsl:when test=".[value() $gt$ 70]" >一般< /xsl:when > < xsl:when test=".[value() $gt$ 60]" >起格< /xsl:when > < xsl:otherwise >不起格< /xsl:otherwise > < /xsl:choose > < /xsl:template > < /xsl:stylesheet > 说明：　　在< xsl:choose >选择中，从第一个< xsl:when >开始，逐个测试，直到满足一个测试条件就将其中的内容输出，不再测试后面的条件；如果不满足任何一个条件，则输出< xsl:otherwise >中的内容。　　标记对< xsl:when >< /xsl:when >与< xsl:otherwise >< /xsl:otherwise >中可嵌套< xsl:if >或< xsl:choose >。运算符、关系与逻辑运算符，特殊字符等　　今天我们学习XSL的各种运算符，满足编写更大灵活性的XSL样式的要求。表一、运算符与特殊字符运算符描述 / 选择子元素，返回左侧元素的直接子元素；如果“/”位于最左侧表示选择根结点的直接子元素 // 递归下降，不论深度，搜索指定的元素；如果位于最左侧表示从根结点出发递归下降搜索指定元素 . 表示当前元素 * 通配符，选择任意元素，不考虑名字 @ 取得属性值，作为属性名的前缀 @* 通配符，选择任意属性，不考虑名字 : 名字作用范围分隔符，将名字作用范围前缀与元素或属性名分隔开来 !* 在相关节点上应用指定方法 ( )* 分组，明确指定优先顺序 [ ] 应用过滤样式 [ ]* 下标运算符，用于在集合中指示元素表二、逻辑运算符比较运算符可选方式描述 and $and$或&& 逻辑与 or $or$或|| 逻辑或 not() $not$ 逻辑非表三、关系运算符 = $eq$ 相等 = $ieq$ 相等（不区分大小写） != $ne$ 不等 $ine$ 不等（不区分大小写） < $lt$ 小于 $ilt$ 小于（不区分大小写） <= $le$ 小于等于 $ile$ 小于等于（不区分大小写） > $gt$ 大于 $igt$ 大于（不区分大小写） >= $ge$ 大于等于 $ige$ 大于等于（不区分大小写） $all$ 集合运算符，如果集合中所有项目均满足条件则返回“真” $any$ 集合运算符，如果集合中任意项目满足条件则返回“真” | 集合运算符，返回两个集合的联合示例一：　　从个人简历中寻找具有具有“WEB开发”技能的人的姓名与E-Mail。假设文档结构如下所示： < document > < resume > < name >name< /name > < sex >sex< /sex > < birthday >birthday< /birthday > < skill >skill1< /skill > < skill >skill2< /skill2 > … < skill >skilln< /skill > < /resume > < resume > … < /resume > … < /document > 　　为从以上结构的个人简历中寻找出所有具有“WEB开发”技能的人的姓名与E-Mail的XSL文档结构如下： < TABLE border="1" cellspacing="0" > < TH >姓名< /TH >< TH >E-Mail< /TH > < xsl:for-each select="resume [ $any$ skill='WEB开发' ]" > < TR >< TD >< xsl:value-of select="name"/ >< /TD > < TD >< xsl:value-of select="E-Mail"/ >< /TD > < /TR > < /xsl:for-each > < /TABLE > 说明： 1.[ ] ───表示选择条件，只有满足条件的个人简历才被显示； 2.$any$ ──由于每个人有多种技能，故加$any$作为前缀，以使每个人所有技能都能被比较； 3.skill='WEB开发' ──筛选条件示例二、　　仍上面的XML文档为例，如果欲选择1977/1/1之前出生的人的姓名、技能与E-Mail，相应的XSL文档结构如下（假定生日格式为yyyy/mm/dd）： < TABLE border="1" cellspacing="0" > < TH >姓名< /TH >< TH >技能< /TH >< TH >E-Mail< /TH > < xsl:for-each select="resume [ birthday $lt$ '1977/1/1' ]" > < TR > < TD >< xsl:value-of select="name"/ >< /TD > < TD >< xsl:value-of select="skill [0]"/ > < xsl:for-each select="skill [index() >0]" >、 < xsl:value-of select="."/ > < /xsl:for-each > < /TD > < TD >< xsl:value-of select="E-Mail"/ >< /TD > < /TR > < /xsl:for-each > < /TABLE > 说明： 1. birthday $lt$ '1977/1/1' ── 搜索条件，在此处使用“< ”会错误，故使用“$lt$”表示小于。 2. skill [0] ─── 表示选择skill的第一项 3. skill [index() >0]───表示选择skill的第二项以后（包括第二项）的项目 4. xsl:value-of select="." ─── 表示选择当前标记的值　　相信大家应该注意到，在前面以及本次的例子中出现了一些函数，如index()、formatIndex()、childNumber()，也许大家还不完全明了其中的含义吧？敬请关注下一课。注：如果拷贝源代码，请将空格删除本期学习XSL样式方法，即可用于XSL元素< xsl:for-each >、< xsl:value-of >、< xsl:template >的select属性、< xsl:apply-templates >的match属性、< xsl:if >、< xsl:when >的test属性中，对元素的范围进行筛选，从而提供更大的灵活性。　　XML与DHTML（动态HTML）一样，这些节点都是一个个对象，而且这些对象都是有层次的，从根节点开始构成一颗层次清淅的树状结构，这就形成了文档对象模型DOM，通过对象的属性、方法来达到访问控制XML节点的目的。　　我们这里不打算就XML的DOM逐一详细阐述，因为这完全可以写成一个篇幅较多的教程，我们先就一些常见的方法作一些讨论，以期对DOM的对象方法有一个大致的了解。　　注：从本期开始，所有示例不再提供完整源代码，如有不明白之处，请仔细阅读前面七期、并动手练手。一、end() 含义：返回集合中最后一个元素。示例：输出最后一份简历假定XML文件格式为： ……< resume >…< /resume >……< resume >…< /resume >…… 相应XSL文件内容为： < xsl:for-each select="resume[end()]" >……< /xsl:for-each > 或 < xsl:templates match="resume[end()]" >……< /xsl:templates > 或 < xsl:apply-template select="resume[end()]" >……< /xsl:apply-template > 二、index() 含义：返回该元素在集合中的位置，返回值是一整数，其中第一个元素返回0 示例：返回前面三份简历 resume[index() $le$ 3] 注意：index()是与父元素相关的，请看下例： < x > < y/ > < y/ > < /x > < x > < y/ > < y/ > < /x > 返回所有< x >中的第一个< y > x/y[index()=0] 或x/y[0] 三、nodeName() 含义：返回元素的名字，即标记名示例：选择任意元素，假如其名字（即标记名）等于“name” *[nodeName()='name'] 或 *[name] 四、number() 含义：将值转换为数值形式，如果不是数值则返回空，要求参数示例：年龄(age)小于30岁的人的简历(resume) resume[number(age) $lt$ 30] 或resume[age $lt$ 30] 五、nodeType() 含义：返回结点类型，结果为是数值。以下是返回值列表：结点类型结点类型值结点的字符形式描述 Element 1 'element' Element Attribute 2 'attribute' Markup-Delimited Region of Text 3 'text' Processing Instruction 7 'processing_instruction' Comment 8 'comment' Document Entity 9 'document' 六、value() 含义：返回元素或属性的值示例：value()是元素或属性的缺省方法，以下表示是等价 name!value()="NAME"与name="NAME" @attr="attribute_value"与@attr="attribute_value" 注：@是属性前缀，@attr表示是属性attr 七、attribute() 含义：返回所有属性结点的集合，等价于“@*” 示例：寻找所有的resume元素，满足条件至少有一个属性的值为“ABC” resume[$any$ attribute()='ABC']或resume[$any$ @*='ABC'] 寻找所有的resume元素，满足条件至少有一个子元素有一个属性的值为“ABC” resume[$any$ */attribute()='ABC']或resume[$any$ */@*='ABC'] 八、comment() 含义：返回所有注释结点示例：例如 resume[$any$ comment()='禹希初的简历'] 表示寻找含有注释语句 < !--禹希初的简历-- > 的元素< resume > 九、cdata() 含义：返回所有CDATA类型的结点的集合示例：例如 resume[$any$ cdata()='禹希初的简历'] 表示寻找含有下述语句（必须是直接子结点） < ![CDATA[禹希初的简历]] > 的元素< resume > 十、node() 含义：返回当前上下文环境中除根结点和属性结点以外的所有结点的集合，等价于 “* | pi() | comment() | text()” 示例：寻找所有元素resume，其最后一个结点的名字为"skill" resume[node()[end()]!nodeName()='skill'] 寻找所有resume元素的第一个结点：resume/node()[0] 十一、textnode() 含义：返回所有文本类型的结点的集合示例：寻找每一个p元素的第二个文本结点 p/textnode(1)或p!textnode(1) 十二、text() 含义：返回所有表示文本字符串的结点的集合，等价于"cdata()|textnode()"；　　本期的内容就介绍至此，另有一个函数date()在本人的机器上一试就发生错误使浏览器自动关闭，还有一个函数pi()本人尚未找到适当的应用方法，就不介绍了，下期将讲述如何XSL中使用脚本。脚本与XSL的结合及应用有时，我们可能会希望XML文档输出时能对其中内容加上一些统计信息或者如编号什么的，利用前面的知识就不太容易实现了。今天将介绍两个新元素< xsl:eval >与< xsl:script >，使我们能轻松处理这个难题。 < xsl:eval > 含义：计算脚本表达式，输出一个文本字符串语法： < xsl:eval language="language-name" > 属性： language ── 规定所用脚本语言的名字，可用的属性有“JavaScript”、“JScript”、“VBScript”、“VBS”等，缺省为“JScript”。 < xsl:script > 含义：声明全局变量或定义函数。语法： < xsl:script language="language-name" > 属性：同< xsl:eval > 示例：　　不知大家对于第四期《跟我学XML》中的例子是否还有印象？其中的XML文档并没有对简历编号，但输出中却加上了大写的罗马数字序号。今天将再举一稍为复杂一些的例子：　　假如我们编写一份年终生产统计表，其中需要小计一项，常规的作法是事先将其算出来，现在不必了，我们可以只给出单项统计，显示时再统计小计一项。请找出《跟我学XML》的第五期，XML文件不必修改，对XSL文件的修改如下： …… < xsl:template match="document" > …… < xsl:apply-templates select="report"/ > < TR >< TD >小计< /TD > < TD >< xsl:eval >total(this,"q1")< /xsl:eval >< /TD > < TD >< xsl:eval >total(this,"q2")< /xsl:eval >< /TD > < TD >< xsl:eval >total(this,"q3")< /xsl:eval >< /TD > < TD >< xsl:eval >total(this,"q4")< /xsl:eval >< /TD > < /TR > < /TABLE > < xsl:script > function total(node,q){ temp=0; mark='/document/report/'+q; v=node.selectNodes(mark); for(t=v.nextNode();t;t=v.nextNode()){ temp+=Number(t.text); } return temp; //小计值 } < /xsl:script > < /xsl:template > 说明：　　黑体部分为添加部分，注意添加部分分为两部分，< xsl:script >< /xsl:script >必须置于< /TABLE >之后，切记。 selectNodes() ── 是XMLDOMObject的一个方法，返回文档中所有满足条件的结点的集合，条件与< xsl:for-each >和select属性的取值采用同样的写法，可以加筛选、下标等限制，如：寻找一季度产量大于等于50的班组 /document/report/q1[value() $ge$ 50] 以上写法还有一个更简单的写法 //q1[value() $ge$ 50] //表示从根结点出发遍历所有结点，寻找满足条件的结点，如果文档内有同名但意义不同的结点则不能用此种方法，非不得已不建议使用。以此为例，如果希望统计年总产量，则可以下述字符串寻找结点（建议使用最后一种，此种描述将精确找到需要汇总的数据） //*[value() $gt$ 0] 或 //(q1|q2|q3|q4) 或 /document/report/(q1|q2|q3|q4) nextNode() ── 返回结点集中的下一个结点 Number() ── 将提供的参数转换为数值 XSL函数二----DOM中对象的方法　　本期介绍多个XSL对于VBScript、JScript增加的方法、属性，以充分发挥XML的优势，用于< xsl:script >、< xsl:eval >标记内表达式的编写或< xsl:if >、< xsl:when >的expr属性。一、absoluteChildNumber 含义：返回结点相对于它所有的兄弟（不论名字是否相同）的序号语法：absoluteChildNumber(node) 参数：node ── 对象，欲返回编号的结点。示例： 1、假定文档结构为：< document >< head/ >< body/ >< /document >，其中document为顶层结点，下述表达式将输出 < xsl:eval > absoluteChildNumber(this.selectNodes('/document/body').item(0)) < /xsl:eval > 2、确定当前结点相对于其所有兄弟的序号 < xsl:eval >absoluteChildNumber(this)< /xsl:eval > 二、ancestorChildNumber 含义：从给定结点出发根据给定祖先结点名返回最近的祖先结点的序号（相对于同名结点）。如果找不祖先，则返回0。语法：ancestorChildNumber(bstrNodeName, pNode) 参数： bstrNodeName ── 字符串。被搜索的祖先结点的名字。 pNode ── 对象。搜索开始位置的结点。示例：查找当前结点最近的名为report祖先结点。 ancestorChildNumber('report',this) 三、attributes 含义：返回结点属性的集合语法：object.attributes 参数：object ── 结点对象示例：当前结点属性的个数 this.attributes.length 当前结点第三个属性的值 this.attributs.item(2).value 或this.attributes.item(2).text 或this.attributes(2).text 注意：如果给定的下标大于属性总和减1将出错，第一个属性的下标是0。四、baseName 含义：返回有名字空间限制的基本名，即不包括名字前缀语法：object.baseName 参数：object ── 结点对象示例：当前结点的基本名：this.baseName 五、childNumber 含义：返回结点相对于同名同胞的序号语法：childNumber(object) 参数：object ── 结点对象示例：假定XML文档结构如下 < x >< y >< z >< z/ >< y/ >< /x > 如果当前结点是z ，则childNumber(this)返回1，而absoluteChildNumber(this)返回3。六、dataType 含义：设定或读取结点的数据类型语法：设定结点的数据类型 object.dataType=objValue 读取结点的数据类型 objValue=object.dataType 参数：object ── 结点对象示例：读取当前结点的数据类型 dtType=this.dataType 七、depth 含义：指定结点出现在文档树上的深度，即该结点位于文档第几层，顶层结点位于第一层，根结点（即用“/”表示的结点）位于第0层语法：depth(pNode) 参数：pNode ── 结点对象示例：当前结点的深度 depth(this) 八、firstChild、lastChild 含义：返回结点的第一个子结点（或最后一个子结点）。语法：pNode.firstChild pNode.lastChild 参数：pNode ── 结点对象示例：当前结点的第一个结点的名字 this.firstChild.nodeName 九、formatIndex 含义：用指定的计数系统格式化提供的整数。语法：formatIndex(lIndex, bstrFormat) 参数： lIndex ── 整型数值或变量 bstrFormat ── 数据格式，可选值有a、A、i、I、1、01（以0打头的数值形式，如果要求固定长度的编号如0001、0002则非常有用）示例：当前结点的大写罗马数字编号 formatIndex(childNumber(this),'I') 十、formatNumber 含义：以指定格式输出数值。语法：formatNumber(dblNumber, bstrFormat) 参数：说明同formatNumber，不同之处在于格式化的可以是小数示例：对变量a的值格式化为两位小数 formatNumber(a,'#.00') 十一、hasChildNodes 含义：如果结点有子结点则返回true（-1），否则为false（0）语法：pNode.hasChildNodes() 注意：与此前介绍的函数不同，此函数后必须带一个空括号示例：判断当前结点是否有子结点 this.hasChildNodes 十二、namespaceURI、prefix 含义：返回结点名字空间的全局资源标识符（或前缀）语法：pNode.namespaceURI pNode.prifix 十三、nextSibling、previousSibling、parentNode 含义：返回结点的下一个兄弟（或前一个兄弟、或结点的父结点）语法：pNode.nextSibling pNode.previousSibling pNode.parentNode 　　注意：对根结点（即“/”）应用parentNode方法、对第一个孩子结点应用previousSibling方法、对最后一个孩子结点应用nextSibling方法均会导致错误，可通过此过关系运算符==（等于）和!=（不等于）来判断一个结点是否某一指定结点，格式为pNode1 = pNode2或pNode2 != pNode2。十四、nodeName 含义：返回元素、属性、入口的名字或其他类型结点的一个特定字符串语法：pNode.nodeName 示例：当前结点的名字 this.nodeName 十五、nodeType、NodeTypeString 含义：返回结点的类型的数值形式（或字符串形式）语法：pNode.nodeType或pNode.nodeTypeString 返回值：结点类型结点类型编号结点类型字符串元素 1 'element' 元素属性 2 'attribute' Markup-Delimited Region of Text 3 'text' Processing Instruction 7 'processing_instruction' Comment 8 'comment' Document Entity 9 'document' 十六、nodeTypedValue 含义：以结点预定义的数据类型返回结点的值语法：pNode.nodeTypedValue 示例：假定当前结点的数据类型是fixed.14.4，下例将以数值返回结点的值，而不是文本一个字符串 this.nodeTypedValue 十七、nodeValue 含义：返回结点的文本语法：pNode.nodeValue 注意：该方法不用于元素类结点，可用于属性、CDATA、注释、文本等结点示例：当前元素第一个属性的值 this.attributes(0).nodeValue 当前元素内的文本（假定该元素内只有文本，无其它元素，即< mark >text< /mark >，建议多尝几次掌握其确切的用法） this.firstChild.nodeValue 十八、ownerDocument 含义：返回包含该结点的文档的根语法：pNode.ownerDocument 注意：该方法用于文档的根结点将出错十九、selectNodes 含义：给定的样式匹配应用于当前结点并返回匹配的结点集合语法：pNode.selectNodes('pattern') 提示：pattern的编写与< xsl:for-each >的select属性的值类似，其中以“/”开头表示从文档的根出发搜索；以“//”开头表遍历文档的所有结点；以“..”开头表示从当前结点的父结点开始；如果欲从当前结点向下搜索则不能有以上特殊字符打头。示例：与当前结点同名的元素在其父元素内的个数 childNumber(this.selectNodes("../"+this.nodeName+"[end()]").item(0)) 当前元素内名字为“skill”的元素的个数 childNumber(this.selectNodes("skill[end()]").item(0)) 二十、selectSingleNode 含义：与selectNodes类似，不同的只返回匹配的第一个结点、而不是结点集合语法：pNode.selectSingleNode('pattern') 示例：与当前结点同名的元素在其父元素内的个数 childNumber(this.selectSingleNode("../"+this.nodeName+"[end()]")) 当前元素内名字为“skill”的元素的个数 childNumber(this.selectSingleNode("skill[end()]")) 二十一、text 含义：返回结点与它的子树内的文字内容语法：pNode.text 示例：整个文档内的文字内容 this.ownerDocument.text 当前元素及其子树的文字内容 this.text 二十二、xml 含义：返回结点及其后代的XML表示语法：pNode.xml 示例：当前文档的XML内容 this.ownerDocument.xml 另有几个函数不作介绍，列于其下以供参考，如感兴趣，请访问http://msdn.microsoft.com获取详细说明。 formatTime(varTime, bstrFormat,varDestLocale) formatDate(varDate, bstrFormat,varDestLocale) apendChild(newChild) definition CloneNode insertBefore(newChild, refChild) parsed removeChild(oldChild) replaceChild(newChild, oldChild) specified transformNode(stylesheet) transformNodeToObject(stylesheet,outputObject) uniqueID(pNode)

作者: starlight 时间: 2003-12-15 01:00 标题: 跟我学XML

概括说一下 HTML注重显示格式 XML注重显示内容（我也是引用别人的结论）
虽然现在还是HTML4。0大行其道但是XHTML将是它的有力替代者已经被W3C确定了
建议bigblock发一下有关XHTML1。0的帖子同学有买了《XHTML技术手册》我翻了一下的确不错虽然有些内容显的有些陈旧但是总体来看不失为一本好书我都把光盘给刻录下来了

作者: bigblock 时间: 2003-12-15 12:23 标题: 跟我学XML

好吧.我试试吧.总结一下就写写看.

欢迎光临黑色海岸线论坛 (http://bbs.thysea.com/)