dedecms采集過濾規(guī)則 萬能采集過濾代碼 常用過濾
導讀:織夢文章
dedecms自帶的采集系統(tǒng)確實很不錯,可以免去一些手工添加信息的麻煩,設置一下dede采集規(guī)則、采集點,然后點采集,OK,幾百篇文章就搞定了!呵呵,確實很省事的!下面介紹幾種常用采集規(guī)則的過濾方法:
應用示例一:dedecms過濾標題空格經(jīng)常在采集文章的時候,標題文字里面有空格,采回來后應用很是麻煩,所以需要在標題處過濾處添加下面正則過濾
{dede:trim} {/dede:trim} 注意:中間是有一個空格
應用示例二:來源作者中連接的過濾在采集文章的時候,有的網(wǎng)站系統(tǒng)里面作者或者來源處都帶有連接,直接采集的話將連接采集回來了,然后由于這兩個字段有限制,通常會造成需要采集的內容沒有采集回來,所以需要在過濾處添加下面正則過濾。
1,如果要保留dedecms鏈接中的文字:{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}
2,如果去掉鏈接中的文字:{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}
應用示例三:文章內容中連接以及其他廣告代碼的過濾這個就不用說了,當需要對所有東西過濾的時候,直接用上面所有的代碼過濾就可以,但是實際應用中,我們只需要對連接、動畫、調用等進行過濾。(這個需要按照對方內容里面具體含有什么代碼來具體操作)一般的只有鏈接,使用二中的代碼進行過濾就可以了,但是實際上一般的網(wǎng)站現(xiàn)在都在內容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
過濾div可以用{dede:trim}]*)>{/dede:trim}{dede:trim}{/dede:trim}
過濾js用下面這個{dede:trim}]*)>([^<]*){/dede:trim}
過濾未知變量字符固定(.*)固定
應用示例四:過濾GG廣告代碼其實這個就是在上面的內容過濾,但是很多論壇里的網(wǎng)友經(jīng)常問這個,所以單獨作為一個應用列出來:
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
下面是在綜合論壇上網(wǎng)友的各種正則的一個dedecms規(guī)則過濾全集:
{dede:trim}<param([^>]*)>{/dede:trim}{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}{dede:trim}<embed([^>]*)>{/dede:trim}{dede:trim}</embed>{/dede:trim}{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}{dede:trim}<object([^>]*)>{/dede:trim}{dede:trim}</object>{/dede:trim}{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}{dede:trim}<OBJECT([^>]*)>{/dede:trim}{dede:trim}</OBJECT>{/dede:trim}{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}{dede:trim}<iframe([^>]*)>{/dede:trim}{dede:trim}</iframe>{/dede:trim}{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}{dede:trim}<IFRAME([^>]*)>{/dede:trim}{dede:trim}</IFRAME>{/dede:trim}{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}{dede:trim}<font([^>]*)>{/dede:trim}{dede:trim}</font>{/dede:trim}{dede:trim}<a([^>]dede后臺模板*)>([^<]*)</a>{/dede:trim}{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}{dede:trim}<td([^>]*)>{/dede:trim}{dede:trim}</td>{/dede:trim}{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}{dede:trim}<tr([^>]*)>{/dede:trim}{dede:trim}</tr>{/dede:trim}{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}{dede:trim}<tbody>{/dede:trim}{dede:trim}</tbody>{/dede:trim}{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}{dede:trim}<table([^>]*)>{/dede:trim}{dede:trim}</table>{/dede:trim}{dede:trim}<img([^>]*)>{/dede:trim}{dede:trim}<span([^>]*)>{/dede:trim}{dede:trim}</span>{/dede:trim}{dede:trim} {/dede:trim}{dede:trim}<stong>{/dede:trim}{dede:trim}</stong>{/dede:trim}
聲明: 本文由我的SEOUC技術文章主頁發(fā)布于:2023-07-18 ,文章dedecms采集過濾規(guī)則 萬能采集過濾代碼 常用過濾主要講述規(guī)則,常用,織夢網(wǎng)站建設源碼以及服務器配置搭建相關技術文章。轉載請保留鏈接: http://www.bifwcx.com/article/web_29853.html
- 上一篇:內容頁調用SEO標題的方法,織夢文章
- 下一篇:怎么修改織夢默認模板路徑,織夢技術