DeDeCMS織夢的采集教程,織夢技術
導讀:織夢技術織夢技術看到很多網友都為織夢(DEDECMS)的采集教程頭疼,的確,官方出的教程太籠統了,什么都沒說,換個網站你什么都做不了,這個教程是最詳盡的教程,讓你一看即會! 第織夢模板網dede商城模板。
看到很多網友都為織夢(DEDECMS)的采集教程頭疼,的確,官方出的教程太籠統了,什么都沒說,換個網站你什么都做不了,這個教程是最詳盡的教程,讓你一看即會!
步驟/方法
第一步、我們打開織夢后臺點擊采集——采集節點管理——增加新節點
第二步、這里我們以采集普通文章為例,我們選擇普通文章,然后確定
第三步、進入了采集的設置頁面,填寫節點名稱,就是給這個新節點取個名字,這里你可以任意填寫。
第四步、打開你想要采集的文章列表頁。(這里我們以這個網站為例http://www.nanmafan.com/xunyicao/打開這個頁面,右鍵——查看源文件找到目標頁面編碼,就在charset后面)
第五步、填寫頁面的基本信息,填完后如圖
第六步、填寫列表網址獲取規則看看文章列表第一頁的地址。
http://www.nanmafan.com/xunyicao/list_49_1.html
對比第二頁的地址http://www.nanmafan.com/xunyicao/list_49_2.html
我們發現了他們除了49_后面的數字不一樣,其他的都一樣,所以我們可以這樣寫
http://www.nanmafan.com/xunyicao/list_49_(*).html
就是把1換成了(*)因為這里只有2頁,所以我們就填從1到2每頁遞增當然是1了,2-1...是等于1吧
這里我們就填寫完了
可能大家采集的有些列表沒有規則,那就只有手工指定列表網址了,如圖
每行寫一個頁面地址
第七步、填寫文章網址匹配規則了,回到文章列表頁
右鍵查看源文件找到區域開始的HTML,就是找文章列表開始的標志。
我們很容易的找到了如圖中的“新聞列表”。從這里開始,后面就是文章列表里
我們再找文章列表結束的HTML
就是這個了,一個很容易找到的標志
如果鏈接中含有圖片:
不處理采集為縮略圖這里根據自己的需要選擇
第八步、對區域網址進行再次篩選:
(使用正則表達式)必須包含:(優先級高于后者)
不能包含:打開源文件,我們可以很清楚的看到,文章鏈接都是以.html結束的所以,我們在必須包含后面填.html如果遇到有些列表很麻煩,還可以填寫后面的不能包含
點擊保存設置進入下一步,可以看到我們獲得的文章網址
看到這些就是對的了,我們保存信息進入下一步設置內容字段獲取規則
dede模板堂我們看看文章有沒有分頁,隨便進入一篇文章看看。。我們看到這里的文章沒有分頁
所以這里的我們就默認了
我們現在來找文章標題等等隨便進入一篇文章,右鍵查看源文件
看看這些
依照源碼填寫
聲明: 本文由我的SEOUC技術文章主頁發布于:2023-07-19 ,文章DeDeCMS織夢的采集教程,織夢技術主要講述標簽,標題,CMS網站建設源碼以及服務器配置搭建相關技術文章。轉載請保留鏈接: http://www.bifwcx.com/article/web_31064.html