LocoySpider中文名是火車采集器,非常好用的一個網站采集和分析工具,免費使用,功能強大,可以通過這個軟件查看這個網站的大部分內容!
軟件介紹
火車采集器是一款專為站長提供的網站采集分析工具,這款軟件幾乎能采集所有網頁,而且速度非常快,采集/發布如同復制/粘貼一樣精準。通過靈活的配置,您可以很輕松的從網頁上抓取文字、圖片、文件等任何資源。
功能詳解
1、規則自定義-通過采集規則的定義,可以搜索所有網站采集幾乎任何類型的信息。
2、多任務,多線程-可以同時進行多個信息采集任務,每個任務可以使用多個線程。
3、所見即所得-任務采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界面中。
4、數據保存-數據邊采集邊自動保存到關系數據庫中,并且數據結構能夠自動適應,軟件可以根據采集規則自動創建數據庫,以及其中的表和字段,也可以通過導庫方式靈活的將數據保存到客戶已有的數據庫結構中。
5、斷點續采-信息采集任務可以在停止后從斷點開始繼續采集,從此你用不再擔心你的采集任務意外中斷了。
6、網站登錄-支持網站Cookie,支持網站可視化登錄,即使登錄時需要驗證碼的網站也能采集。
7、計劃任務-通過這個功能可以讓你的采集任務定時、定量或者一直循環執行。
8、采集范圍限制-可以根據采集的深度和網址的標識來限制采集的范圍。
9、文件下載-可以將采集到的二進制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數據庫中。
10、結果替換-可以將采集的結果根據規則替換成你定義的內容。
11、條件保存-可以根據某個條件來決定那些信息保存,那些信息過濾。
12、過濾重復內容-軟件可根據用戶設置和實際情況對重復內容和重復網址自動刪除重復內容。
13、特殊鏈接識別-運用此功能可以將用JavaScript動態生成的鏈接或其他更古怪的連接識別出來。
14、數據發布-可以通過自定義接口,將已采集的結果數據發布到任意的內容管理系統和指定數據庫中,F在已支持的目標發布媒體包括:數據庫(access,sqlserver,mysql,oracle),靜態htm文件。
15、預留編程接口-定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。
- PC官方版
- 安卓官方手機版
- IOS官方手機版