在做提取网页数据,正则表达式提取特定汉字,比如提取“转发数:”,怎么写?

日期:2012-10-26 09:28:19 人气:2

在做提取网页数据,正则表达式提取特定汉字,比如提取“转发数:”,怎么写?

直接写 “转发数:”... 很多情况是 转发数:3876 这种,可以直接写个简单的正则来拿到后面的数字。 转发数:[^>]*>[^>]*>([^<]*)< 解释:“转发数:后面不等于 大于号 的所有值,这样就能拿到第一个 的大于号,然后自己补一个大于号,然后在跳过一个不为大于号的所有字符,就是 red 后面的大于号了,然后在自己补一个大于号,这时候你的光标起点就是 3 这个数字前面,那么只要拿到光标位置到不为小于号之间的所有值,那就是你需要的那个数字了
    A+
热门评论