快速的采集一些網頁上面的信息,你總是需要各種各樣的軟件的,本站現在就可以免費的為你帶來下面的這款最新的內容采集與信息發布的數據處理軟件--杰靈網頁采集器!
杰靈網頁采集器特點
1:支持手動單頁模式,指定URL采集內容,采集內容可在編輯器里排版修改。
2:支持從列表頁提取網址后再采集,可提取列表頁相關內容。
3:支持從內容頁衍生的(無限)多級頁面抓取(多級頁支持分頁)
4:支持多任務多線程同時采集不同目標網頁信息
5:支持自定義COOKIE、UserAgent等Header頭信息。
6:采集每個字段內容,可關聯組合字段內容,可選擇多種字符串后處理方式
7:支持圖片本地化,添加LOGO水印,支持圖片本地化命名格式
8:自帶數據庫簡易查看數據功能
9:關鍵詞自動分詞
10:同義詞替換,可自定義同義詞詞庫
11:關鍵詞內鏈功能,可自定義關鍵詞詞庫
杰靈網頁采集器常見問題
網頁亂碼怎么辦?
在設置里選擇相應的網頁編碼。
如何添加任務?
點擊任務欄,右鍵選擇菜單。
如何發布到dedecms?
將軟件內的發布接口下的dedecms接口放到網站子目dede下即可
杰靈網頁采集器更新日志
1、內容提取支持最多10級【參數】循環提取,適合(論壇問答回復采集頭像,用戶名,發布時間,及內容)
2、增加關鍵詞自動分詞
3、增加同義詞替換,可自定義同義詞詞庫
4、增加關鍵詞內鏈功能,可自定義關鍵詞詞庫,可限定替換頻率。 (并可解決帝國IMG,A元素嵌套替換的BUG)
5、增加計劃任務功能
6、下載附件支持帶COOKIE登陸下載
7、發布規則 支持使用 全局標簽函數 如帝國目錄newspath 可使用{dd:日期yyyymmdd}
8、增強規則導入導出功能。
9、增加PHP腳本擴展(測試中)
10、可指定單次采集內容網址最大數
- PC官方版
- 安卓官方手機版
- IOS官方手機版