用VB.NET和XPath简化XML导航
用VB.NET进行XML导航
XML文档可能包含1~1000个或者更多的元素。你可能需要访问XML文档包含的全部数据,或者访问这些数据的一个选定的子集。XPath提供了定位和选择XML子集的语法,从而简化了这一任务。.NET框架使用XPathNavigator类来执行XPath命令,但要想利用它,必须有一个可用的XML文档。
可用.NET XPathDocument类来处理一个XML文档的创建或检索。这个类提供了大量方法和属性,但我们重点关注的是CreateNavigator方法。该方法创建一个和XML文档对应的XPathNavigator对象。在本文的例子中,将使用下面这个基本的XML文档:
<?xml version="1.0" encoding="utf-8" ?>
<sites>
<website>
<name type="Application Development">Builder.com</name>
<link>www.builder.com</link>
</website>
<website>
<name type="Information Technology">TechRepublic</name>
<link>www.techrepublic.com</link>
</website>
<website>
<name type="Technology News">News.com</name>
<link>www.news.com</link>
</website>
</sites>
假定上述XML存储在一个本地文件中,例如C:builder.xml,你可用以下VB.NET代码为其指派一个XPathNavigator对象:
Dim xpathDoc As XPathDocument
Dim xmlNav As XPathNavigator
Try
xpathDoc = New XPathDocument("c:builder.xml")
xmlNav = xmlDoc.CreateNavigator()
Catch ex As XPathException
System.Console.WriteLine("XMLException: " + ex.Message)
Catch ex As Exception
System.Console.WriteLine("Exception: " + ex.Message)
End Try
注意,用于访问XML文档的代码封闭在一个try/catch块中,以便处理可能发生的任何运行时异常。另外要注意,你需要包括以下命名空间,以便在自己的代码中利用XML类:
imports System.Xml.XPath
该命名空间允许你直接使用需要的类,而不必包括完全限定名称。除了迄今为止用到的类之外,在处理XML数据时还要用到XPathNodeIterator和XPathExpression类。
XML数据导航
XPathNodeIterator类包括以下用于遍历XML文档的方法:
- MoveTo――转到XML文档内的一个特定节点
- MoveToNext――转到下一个同辈节点,当前节点用作基节点
- MoveToPrevious――转到上一个同辈节点,当前节点用作基节点
- MoveToRoot――转到XML文档的根节点
- MoveToParent――转到当前节点的父节点
以下示范代码展示了如何运用这些方法:
Dim xpathDoc As XPathDocument
Dim xmlNav As XPathNavigator
Dim xmlNI As XPathNodeIterator
xpathDoc = New XPathDocument("c:builder.xml")
xmlNav = xpathDoc.CreateNavigator()
xmlNI = xmlNav.Select("/sites/website")
While (xmlNI.MoveNext())
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
End While
上述代码遍历由XPath表达式(例如/sites/website)返回的所有节点。表达式返回所有website节点,并将sites节点当作父节点(也就是根节点)。MoveNext方法可由XPathNodeIterator基类使用,但前面列出的其他方法要求一个节点作为起点。当前节点是用XPathNodeIterator类的Current属性来访问的。
以下示范代码对上例进行了扩展,它使用MovePrevious方法在初始循环之后反向遍历节点列表:
Dim xpathDoc As XPathDocument
Dim xmlNav As XPathNavigator
Dim xmlNI As XPathNodeIterator
xpathDoc = New XPathDocument("c:builder.xml")
xmlNav = xpathDoc.CreateNavigator()
xmlNI = xmlNav.Select("/sites/website")
While (xmlNI.MoveNext())
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
End While
Do
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
Loop While (xmlNI.Current.MoveToPrevious())
可用其他方法在搜索结果中遍历。除此之外,可利用大量属性来确定一个节点的特征。下面进行了简要总结:
- HasAttributes――指明一个节点是否具有Attributes的布尔值
- HasChildren――指明一个节点是否有子节点的布尔值
- IsEmptyElement――指明当前节点是否为空的布尔值
- Name――当前节点的名称
- NodeType――节点类型
- Value――与节点对应的文本值
以下代码利用上述2个属性来确定节点的特征:
While (xmlNI.MoveNext())
If Not (xmlNI.Current.IsEmptyElement) Then
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
End If
If Not (xmlNI.Current.HasAttribute) Then
// work with attributes
End If
End While
当然,使用XPath可以轻松地操纵节点。以下表达式将返回具有特定Attribute值的节点:
/sites/website[@Type="Technology News"]
定位所需数据
XPath规范简化了XML文档导航,本文的例子证明它极易上手。