如何使用QueryList快速提取HTML页面中P标签文本并转换为数组?

使用 querylist 快速读取 html 中 p 标签数据

在 html 页面中,想要读取

标签内的文本内容并将其分数组,可以使用基于 php 的开源框架 querylist。

步骤:

  1. 安装 querylist 框架
  2. 实例化 querylist 对象,并将 html 文档作为参数传递
  3. 使用链式方法检索所有

    标签

  4. 标签中提取文本内容

  5. 将文本

    内容存储在数组中

示例代码:

第四章 医学微生物学(助理不考)

第一节 微生物的基本概念

'; $ql = QueryList::html($html); $result = $ql->find('p')->texts()->toArray(); print_r($result); // 输出:Array ( [0] => 第四章 医学微生物学(助理不考) [1] => 第一节 微生物的基本概念 ) ?>

注:

  • 省事一点,可以直接使用 querylist 进行数据读取,无需逐个编写复杂的正则表达式。
  • querylist 框架提供了丰富的选择器和操作方法,可以方便地处理 html 文档。