win7系統下載
當前位置: 首頁 > 網絡軟件教程 > 詳細頁面

火車采集器-LocoySpider-火車采集器下載 v10.0.21.705免費版

火車采集器-LocoySpider-火車采集器下載 v10.0.21.705免費版
  • 軟件類型:網絡軟件
  • 軟件語言:簡體中文
  • 授權方式:免費軟件
  • 更新時間:2023-03-14
  • 閱讀次數:
  • 推薦星級:
  • 運行環境:WinXP,Win7,Win10,Win11
軟件介紹
分享到: 0

火車采集器(LocoySpider)是一款專業的功能強大的網絡數據/信息挖掘軟件,通過靈活的配置,您可以很輕松的從網頁上抓取文字、圖片、文件等任何資源。

火車采集器(LocoySpider)

程序支持遠程下載圖片文件,支持網站登陸后的信息獲取,支持探測文件真實地址,支持代理,支持防盜鏈的采集,支持采集數據直接入庫和模仿人手工發布等許多功能特點。

火車采集器支持從任何類型的網站采集獲取您所需要的信息,如各種新聞類網站、論壇、電子商務網站、求職招聘網站等。

同時具有強大的網站登錄采集、多頁和分頁的采集、網站跨層采集、POST采集、腳本頁面采集、動態頁面采集等高級采集功能。

強大的php和c#插件支持,讓您可以通過二次開發實現您所想要的任何更強大的功能。

軟件特色

1、通用性強

無論新聞、論壇、視頻、黃頁、圖片、下載類網站,只要通過瀏覽器能看到的結構化的內容,通過指定匹配規則,都能采集到您所需要的內容。

2、穩定、高效

五年磨一劍,軟件不斷更新進步,采集速度快,性能穩定,占用資源少。

3、擴展性強、適用范圍廣

自定義web發布,自定義主流的數據庫的保存和發布,自定義本地php及.net外部編程接口處理數據,讓數據都能為你所用。

菜單功能

1.新建分組

新建一個任務分組,選擇所屬分組,確定分組名稱和備注。

2.新建任務

確定所屬分組,新建一個任務,填寫任務名稱并保存。

3.Web發布配置

Web發布配置定義了如何登陸一個網站以及向該網站提交數據。

主要涉及到登錄信息的獲取,網站編碼設定,欄目列表的獲取,以及使用數據測試發布效果。

火車采集器(LocoySpider)

4.Web發布模塊

可以定義網站登錄,獲取欄目列表,獲取網頁隨機值,內容發布參數,以及上傳文件,構造發布數據等高級功能。

5.數據庫發布配置

數據庫發布配置定義了數據庫鏈接信息的設置以及數據庫模塊的選擇。

6.數據庫發布模塊

用于編輯數據庫的發布模塊,方便我們將數據發布到配置好的數據庫中。

火車采集器可選mysql、sqlserver、oracle、access四種數據庫類型,在文本輸入框中填寫sql語句

(需有數據庫相關知識),并可使用標簽替換相應數據。也可在采集器模塊文件夾中加載某一模塊進行編輯。

火車采集器(LocoySpider)

7.計劃任務

設置列表中采集任務的啟動計劃,可每間隔、每天、每周、僅一次、或自定義Cron表達式,

(Cron表達式的寫法可參考相關術語中的介紹)。保存設置后,任務即可按照設置執行。

8.插件管理

插件是可以用來擴展火車采集器功能的程序

火車采集器V9支持PHP源碼、C#源碼、C#類庫三種類型的插件,

可用于擴展http請求、內容處理和文件下載的功能,并可以分別進行測試。

9.http二級代理

網絡中的服務器,可以讓網絡用戶去取得所需要的網絡信息。

代理的功能有可以突破自身ip的訪問限制訪問國外站點,訪問一些單位或團體內部資源,

突破電信的ip封鎖和隱藏真實的ip等。

火車采集器V9支持http代理、socket4和socket5代理。

火車采集器(LocoySpider)

10.http模擬請求

可以設置如何發起一個http請求,包括設置請求信息,返回頭信息。并具有自動提交的功能。

基本功能

1、規則自定義 - 通過采集規則的定義,可以搜索所有網站采集幾乎任何類型的信息。

2、多任務,多線程 - 可以同時進行多個信息獲取任務,每個任務可以使用多個線程。

3、所見即所得 - 任務采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界面中。

4、數據保存 - 數據邊采集邊自動保存到關系數據庫中,并且數據結構能夠自動適應,軟件可以根據采集規則自動創建數據庫,以及其中的表和字段,也可以通過導庫方式靈活的將數據保存到客戶已有的數據庫結構中。

5、斷點續采 - 信息收集任務可以在停止后從斷點開始繼續采集,從此你用不再擔心你的采集任務意外中斷了。

6、網站登錄 - 支持網站Cookie,支持網站可視化登錄,即使登錄時需要驗證碼的網站也能采集。

7、計劃任務 - 通過這個功能可以讓你的采集任務定時、定量或者一直循環執行。

8、采集范圍限制 - 可以根據采集的深度和網址的標識來限制采集的范圍。

9、文件下載 - 可以將采集到的二進制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數據庫中。

10、結果替換 - 可以將采集的結果根據規則替換成你定義的內容。

11、條件保存 - 可以根據某個條件來決定那些信息保存,那些信息過濾。

12、過濾重復內容 - 軟件可根據用戶設置和實際情況對重復內容和重復網址自動刪除重復內容。

13、特殊鏈接識別 - 運用此功能可以將用JavaScript動態生成的鏈接或其他更古怪的連接識別出來。

14、數據發布 - 可以通過自定義接口,將已采集的結果數據發布到任意的內容管理系統和指定數據庫中。現在已支持的目標發布媒體包括:數據庫(access, sql server,my sql,oracle) ,靜態htm文件。

15、預留編程接口 - 定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。

特色功能

1、支持所有網站編碼:完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼。

2、多種發布方式:支持目前所有主流和非主流的CMS,BBS等網站程序,通過系統的發布模塊能實現采集器和網站程序間的完美結合。

3、全自動:無人值守工作,配置好程序后,程序將依據您的設置自動運行,完全無需人工干預。

4、本地編輯:本地可視化編輯已采集的數據。

5、采集測試:這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結果并測試發布。

6、管理方便:使用站點+任務方式管理采集節點,任務支持批量操作,再多的數據管理也很輕松。

更新日志

火車采集器V10.0版

1.數據獲取中支持調用其他標簽的值作為截取條件。

2.數據獲取支持CSS selector,很多網頁的css 的屬性唯一,此功能更利于批量從網頁中提取數據。

3.增加關聯區域功能,可以截取網頁中指定區域內容進行采集處理。

4.批量網址增加區間變化的網址增加方式,適應更多的網頁地址變化方式。

5.批量設置增加新增加功能的批量設置。

6.運行統計日志設置添加默認關閉功能,可在設置中選擇開啟或關閉。

7.oss相關問題修復。

8.網址空格問題導致列表頁標簽錯誤問題修復。

9.下載相關問題修復。

10.修復“任務數據批量處理”中刪除為空記錄無效的問題。

11.文件下載插件增加文件下載后處理接口。


常見的網絡操作系統有UNIX、Netware、Windows NT、Linux等,網絡軟件的漏洞及缺陷被利用,使網絡遭到入侵和破壞。


點下面下載:(推薦使用"迅雷"進行下載,系統下載大全QQ交流群:)
主站蜘蛛池模板: 色综合.com| 国产精品综合久成人| 狠狠色色综合网站| 亚洲啪啪综合AV一区| 俺来也俺去啦久久综合网| 国产精品无码久久综合网| 美国十次狠狠色综合| 亚洲综合精品网站| 婷婷五月六月激情综合色中文字幕| 亚洲欧美成人久久综合中文网 | 亚洲国产精品综合久久一线 | 99精品国产综合久久久久五月天| 亚洲成色在线综合网站| 夜鲁鲁鲁夜夜综合视频欧美| 婷婷久久综合九色综合绿巨人 | 色青青草原桃花久久综合| 亚洲国产成人久久综合野外| 日韩欧美亚洲综合久久| 浪潮AV色综合久久天堂| 色爱无码AV综合区| 婷婷五月综合激情| 欧美色综合久久久久久| 伊人色综合久久天天网| 亚洲综合日韩中文字幕v在线| 久久综合伊人77777麻豆| 婷婷四房综合激情五月在线| 久久综合久久性久99毛片| 久久综合亚洲色HEZYO社区| 久久亚洲高清综合| 欧美韩国精品另类综合| 狠狠色综合网站| 婷婷成人丁香五月综合激情 | 国产亚洲综合色就色| 色综合久久天天综线观看| 国产巨作麻豆欧美亚洲综合久久| 亚洲综合久久综合激情久久| 日韩亚洲国产综合久久久| 亚洲综合激情另类专区| 97久久天天综合色天天综合色hd| 99久久婷婷国产综合亚洲| 色综合久久久久综合99|