Dedecms自带的采集过滤规则详细说明
Dedecms自带的采集过滤规则详细说明
dedecms自带采集系统刚开始研究下了不下60条规则收集以下万能过滤代码
gbk5.6版本测试全部可以用
dedecms过滤标题空格标题关键词过滤
经常在采集文章的时候,标题文字里面有空格网站关键词,,所以需要在标题处过滤处添加下面正则过滤
{dede:trim} {/dede:trim} 中间可以是过滤空格或者是文字
来源作者中连接的过滤
1,如果要保留dedecms链接中的文字:
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
2,如果去掉链接中的文字:
{dede:trim}]*)>([^<]*){/dede:trim}
文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
过滤div可以用
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
过滤js用下面这个
{dede:trim}]*)>([^<]*){/dede:trim}
过滤未知变量字符
固定(.*)固定
下面是过滤GG广告代码
{dede:trim}{/dede:trim}
下面是在综合论坛上网友的各种正则的一个dedecms规则过滤全集:
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
]*)>([^>]*){/dede:trim}{dede:trim}
{/dede:trim}{dede:trim}
{/dede:trim}{dede:trim}
{dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
https://www.360docs.net/doc/1f2758255.html, https://www.360docs.net/doc/1f2758255.html, https://www.360docs.net/doc/1f2758255.html,
掌握了这些,过滤基本上就不用求人了!下面教大家一个更简单的方法,把下面的过滤规则复制到你那里去,几乎就可以处理所有的问题了,当然也可以自己分析一下。
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
- {/dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}