雷火电竞官网-中国知名电竞赛事平台

當下軟件園 / 匯聚當下最新最酷的軟件下載站!
當下軟件園

您的位置: 首頁 > 網絡軟件 > 網頁輔助 > 善肯網頁TXT采集器 V1.0 免費版

  善肯網頁TXT采集器是款專業的網頁文本采集工具。它可以幫助用戶下載到一些網站的小說文章,通過專業的正則表達式篩選,去除掉不必要的內容,非常的簡單實用。

  善肯網頁TXT采集器

【使用說明】

  1、規則設置:

 ?、僭谝巹t設置窗口,在網站中隨便找一篇文,不寫任何規則,先點擊實時預覽,看看能不能獲取網頁源代碼,能獲取則再寫規則,不能獲取就沒必要繼續了。

 ?、谝巹t設置使用的是正則表達式匹配內容,有一定基礎最好,沒基礎也可以參考給的范例,簡單學習下,不需要深入學習正則。

  ③規則設置的時候,目錄頁和內容頁需要分開預覽,也就需要兩個鏈接,一個目錄頁鏈接、一個內容頁鏈接。

  ④關于替換,有通用替換和定制替換,這里目前不需要正則,普通替換就好,需要注意的是必須要輸入值,空格也行。刪除:選中整行,再按住delete鍵就行。內置\n再作為替換數據的時候代表換行。

 ?、菥幋a,目前只設置有GBK和UFT-8,差不多大多數網站就是這兩種編碼其中之一。

  2、解析與下載

 ?、俳馕稣埌唇馕龅刂?按鈕,1按鈕目前任性不想刪,后面要開發其他功能,

 ?、谥С謫握鹿澫螺d和全文下載。

 ?、壑С痔砑诱鹿潝怠居械男≌f沒有章節數的時候就可以勾上】

 ?、苤С衷诰€看,但是需要聯網,此功能只是輔助,并非專業的看小說軟件。

 ?、菹螺d進度和總需時間顯示,內置多線程。

  3、關于軟件

 ?、倨鋵嵵灰?exe就行,規則全是自己添加,commonrule.xml里面是通用替換規則。網站規則在rule文件夾下。我這邊在里面放了兩個網站的規則,主要是測試的時候是用的。其他網站規則,大家可以自己添加,或者支持開發者也行。

  ②軟件沒加殼,c#開發的,沒放病毒。不放心請不要用,我不背鍋。

 ?、坳P于軟件里面有個www.52pojie.cn跳轉到論壇,我個人測試跳轉的時候被360提示了,也有可能是因為跳轉的是360瀏覽器,不知道你們會不會有這個問題。

  ④xml里面的內容,如果不清楚的話還是不要動它,免得軟件識別失敗報錯。

軟件特別說明

標簽: 文字采集 網頁采集器

其他版本下載
網友評論
回頂部 去下載

關于本站|下載幫助|下載聲明|軟件發布|聯系我們

Copyright ? 2005-2024 m.obymc.com.All rights reserved.

浙ICP備2024132706號-1 浙公網安備33038102330474號