Java DOM怎么获取指定标签名的所有元素

getElementsByTagName() 方法最直接有效,用于获取指定标签名的所有元素,返回实时 NodeList,可作用于 Document 或 Element,参数为标签名字符串。

Java DOM 中获取指定标签名的所有元素,用 getElementsByTagName() 方法最直接有效。

使用 getElementsByTagName() 获取所有匹配元素

这是 DOM API 提供的标准方法,返回一个 NodeList,包含当前节点下所有指定标签名的 Element 节点(不区分大小写,按 XML/HTML 规范处理)。

  • 调用对象可以是 Document(查全文档),也可以是任意 Element(查其子树)
  • 参数是标签名字符串,如 "div""a""book"
  • 返回的 NodeList 是实时的(live),后续 DOM 变化会反映在该列表中

基础代码示例

假设已加载好 Document doc

NodeList divList = doc.getElementsByTagName("div");
for (int i = 0; i < divList.getLength(); i++) {
    Element div = (Element) divList.item(i);
    System.out.println("ID: " + div.getAttribute("id"));
    System.out.println("Text: " + div.getTextContent().trim());
}

注意:必须强制转换为 Element 才能调用元素专属方法(如 getAttributegetTextContent)。

只取第一个或按条件筛选

如果只需要首个匹配元素,可直接取 item(0);若需更灵活筛选(如带特定 class 或属性),建议遍历后判断:

  • if (div.hasAttribute("class") && div.getAttribute("class").contains("active"))
  • 也可用 getElementsByTagName("*") 获取所有元素,再逐个检查 tagName

替代方案:XPath(适合复杂查询)

当需要 CSS 选择器类似能力(如 div.content ainput[type='text']),推荐用 XPath:

XPath xpath = XPathFactory.newInstance().newXPath();
NodeList links = (NodeList) xpath.compile("//a[@href]").evaluate(doc, XPathConstants.NODESET);

比纯 DOM 方法表达力更强,但需额外引入 XPath 支持,且性能略低。

基本上就这些。日常用 getElementsByTagName() 足够应对大多数“找同名标签”的需求,简单、标准、无需依赖。