易语言资源网 - 做最全的易语言资源下载社区
【周六更新】【2021开源大赛(第六届)】全部参赛作品信息 精易论坛授权登录

【模块更新】HZKpath HTML解析模块 重大更新V3.0正式发布   [复制链接]

    2022-05-23 11:05:35
    易语言模块
    易语言资源网
    492 次浏览
    来源链接

模块功能:

  用类似xpath表达式的方式进行html解析

更新记录:20220509 V3.0

  • 精简代码优化效率!!!实测取3698条数据从4s+ 减少到700ms
  • 多线程继续优化!!!!!群友实测25+线程同时工作CPU占用10%
  • 多线程请编译运行!!!多线程请编译运行!!!多线程请编译运行!!!(重要的事情说三遍)
  • 增加了几个判断,没有数据直接返回,防止没有数据或者解析失败的情况下CPU占用过多
  • 命令更改:从初始化_解析文本()改为解析html文本
  • 命令更改:从表达式_置表达式解析解析取结果改为解析取结果
  • 命令更改:从表达式_自动初始化表达式解析改为临时解析
  • 类名称从 类_HZKpath 改回 HZKpath 并且以后不在变动(为方便输入)
  • 解析表达式结构时判断引号!!!支持单引号、双引号和没有引号
  • 增加新条件比较符号:不包含!<>
  • 增加标签:css选择器语法支持,语法为//css[],具体请看手册
  • 增加变量:%hhf%换行符,可用在文本中,具体请看手册
  • 增加变量:%t[]t%文本转义,用于当文本中有表达式分隔符时正确识别文本,,具体请看手册
  • 增加判断属性是否存在功能,用法是//a[@href],作用是取出存在href属性的a标签
  • 增加特殊属性:@@html,取出此标签html代码,可以后面加属性表达式进行条件比较或者取出结果使用,也可写为@@outerhtml,具体请看手册
  • 增加特殊属性:@@innerhtml,取出不包含此标签的内部html代码
  • 增加特殊属性:@@textcontent,取出内部文本,与@@text结果一致,待测试
  • 增加强制取属性值的功能,用法@@@+标签名,如@@@width,用于取出无法取出的属性值,原理是模块内加了正则表达式进行文本解析,具体请看手册
  • 调整属性表达式的目的:对取出文本进行修改
  • 属性表达式可以用于尾部对取出的属性进行文本处理,具体请看手册
  • 属性表达式可以多个使用,用,分割,具体请看手册
  • 增加属性表达式:删首尾空 %sswk%,具体请看手册
  • 增加属性表达式:正则表达式,%re[正则表达式]re% ,具体请看手册
  • 增加属性表达式:删除文本 %del[删除内容]del%,具体请看手册
  • 增加属性表达式:取出格式化文本 %f[文本前缀%text%文本后缀]f%,具体请看手册
  • 增加属性表达式:嵌套表达式`%path[hzkpath表达式]path%,可以对取出的文本进行表达式再次解析,可以用于同时取出多个不同级别标签下的不同属性,取出第一个寻找到的结果,具体请看手册
  • 增加属性表达式:替换文本%th[被替换文本,替换文本]th%,可以对取出的文本进行文本替换,具体请看手册
  • 增加属性表达式:取某文本中间%mid[文本前缀,文本后缀,是否从两头寻找]mid%,对取出的文本取出前后缀中间的东西,具体请看手册
  • 增加属性表达式:加文本前后缀%add[文本前缀,文本后缀]add%,对取出的文本增加前缀和后缀,具体请看手册
  • 注意:此版本保留了之前版本的{%num%}取整数的功能,取出指定格式文本请使用%f[%text%]f%
  • 修复空表达式会导致数组溢出的BUG
  • 修复条件 or(数字) 这种格式的条件,可以同时取出指定位置的标签,具体请看手册
  • 增加条件负数整数,取出倒数的标签,如//a[-1]取出倒数第一个a标签
  • 增加连续整数条件,可以是正数或者负数,//a[2~6]取出第2到第6个a标签,//a[3~-2]取出第3到倒数第2个a标签
  • 当整数条件不写条件类型时,为取出前一个条件结果中的第几个标签,写条件类型时为所有标签的第几个标签,具体请看手册
  • 修复了属性表达式返回的结果包含条件时,没有指定字符的结果的BUG
  • 公开模块内的HZK文本模块的代码,可以调用,跟精易语言不同,此套文本指令按字符数量工作而不是文本实际长度




点我下载 (已有 52 次下载)

模块元信息


模块名称: 模块作者:
模块版本: 模块大小:
模块MD5:
版权声明:
模块描述:
模块备注:
引用支持库:
查看 命令信息



[错误报告]   上一篇:小杰_窗口自动排列模块...     下一篇:流式Deflate同步压缩模块 - de...