久久九九热,亚洲国产日产韩国欧美综合,亚洲日本va午夜中文字幕久久,亚洲国产日韩在线人高清

蜻蜓手游網(wǎng),分享真實精致軟件資源!

XPath2Doc(半自動采集網(wǎng)頁生成Word Docx文件) 1.0.0.0最新版

  • XPath2Doc(半自動采集網(wǎng)頁生成Word Docx文件)
  • 大小:

    14.7M
  • 時間:

    2019-06-23 10:57
  • 語言:

    中文
  • 版本:

    1.0.0.0最新版
  • 等級:

    3級
  • 平臺:

    Windows
  • 類別:

    官方版/ 免費 /實用工具
  • 官網(wǎng):

    暫無
  • 廠商:

  • 備案號:

好評:50%
壞評:50%
掃描二維碼下載到手機
XPath2Doc(半自動采集網(wǎng)頁生成Word Docx文件)1.0.0.0最新版截圖0
XPath2Doc(半自動采集網(wǎng)頁生成Word Docx文件)1.0.0.0最新版截圖1

XPath2Doc(半自動采集網(wǎng)頁生成Word Docx文件)介紹

《XPath2Doc》是一款由liucq在52pojie發(fā)布的一個半自動采集網(wǎng)頁生成WordDocx文件的工具,軟件可以采集網(wǎng)站的源代碼,并把重要的數(shù)據(jù)寫入到word文檔中,方便需要的朋友!今天小編為大家?guī)碜钚掳娴南螺d地址,需要的朋友快來下載吧!

XPath2Doc(半自動采集網(wǎng)頁生成Word Docx文件)

軟件介紹

很多人需要從網(wǎng)站采集一些數(shù)據(jù)填寫Word模板,手工操作費時費力還容易出錯,所以我給朋友寫了這個工具。本程序只支持Docx格式的模板文件。

本程序不是爬蟲,不是自動采集工具,不能自動登錄網(wǎng)站。需要自己在WebBrowser窗口里面手工登錄,并找到需要的數(shù)據(jù)頁面,然后點擊程序按鈕進行采集,所以是個半自動的網(wǎng)頁數(shù)據(jù)填充Docx工具。

工作原理

網(wǎng)頁的每個元素,都可以表示成為XPath語句,所以我們可以讀取瀏覽器打開的網(wǎng)站頁面源代碼,通過XPath語句得到網(wǎng)頁元素中的文本。

運行環(huán)境

Windows7Sp1操作系統(tǒng)請安裝下面的組件(重要:VC庫如果不安裝,本程序無法啟動):

1、.NetFramework4.5.2。https://www.microsoft.com/en-us/download/details.aspxid=42642

2、32位VC2017(或更高版本)運行庫。https://support.microsoft.com/zh-cn/help/2977003/the-latest-supported-visual-c-downloads

下載vc_redist.x86.exe

在Windows10系統(tǒng)下上述組件一般自帶,不需要單獨安裝。Windows101903運行通過。

不支持WindowsXP操作系統(tǒng)。

使用方法

1、本程序工作需要三個配置文件:General.ini,自定義.ini,自定義模板.docx。后兩個文件名自己定義。

General.ini文件中定義了INI文件和Docx模板文件的存放目錄,可以不填,默認是程序所在目錄。

自定義.ini、自定義模板.docx是軟件使用者自己創(chuàng)建的網(wǎng)頁采集XPath語句及最后生成文件所用的Docx模板,具體設(shè)置方法請看ini文件中的說明。注意,Docx模板文件中的“@<#0001#>@”之類的字符是在INI文件中定義的用于替換網(wǎng)頁采集內(nèi)容的標(biāo)記字符串。ini文件中定義了替換關(guān)鍵字的前后綴和模板文件名。

2、使用本程序前,請先建立好你自己的INI配置文件和Docx模板文件。(具體可以參見附帶的企查查、天眼查兩個配置文件和起訴書模板)

需要說明的是,模板文件支持對文檔的不同部分使用不同的網(wǎng)址進行采集,注意Url的設(shè)置。

3、使用方法:

啟動程序--選擇模板--點擊采集數(shù)據(jù)按鈕旁邊的黑色三角符號,點開下拉菜單,點擊需要采集的部分。等候瀏覽器加載網(wǎng)頁完畢,手工輸入需要查詢的內(nèi)容,點擊查詢,找到數(shù)據(jù)的具體頁面,然后點擊采集數(shù)據(jù)按鈕,觀察右側(cè)的列表中是不是已經(jīng)得到需要的數(shù)據(jù)。繼續(xù)點開下拉菜單,選擇下一個需要采集的部分,如果網(wǎng)址發(fā)生了變化要等候瀏覽器加載完畢,找到需要的數(shù)據(jù)頁面。點擊采集數(shù)據(jù)按鈕觀察右側(cè)列表中是不是得到了第二部分的數(shù)據(jù)。如此反復(fù),直到數(shù)據(jù)全部采集完畢。

如果前后兩部分的網(wǎng)址相同,在點擊下一部分的下拉菜單之前,要先在瀏覽器中重新查詢新的數(shù)據(jù),等新數(shù)據(jù)頁面出來之后在點擊下拉菜單選擇下一部分進行采集。(網(wǎng)址相同的情況下,點擊下一部分會直接從網(wǎng)頁取數(shù)據(jù),如果瀏覽器沒有換頁面,數(shù)據(jù)就錯了。)如果某個部分需要重新采集,請先點擊下拉菜單中的該部分名稱,然后點擊采集按鈕重復(fù)采集該部分(此時可以隨意改變?yōu)g覽器的數(shù)據(jù)頁面,得到的就是不同公司數(shù)據(jù))。

列表中采集得到的數(shù)據(jù)結(jié)果如果有偏差,可以單擊自行修改。XPath語句如果有什么錯誤,也可以自己修改看測試結(jié)果(XPath語句在修改后會立即重新抓取瀏覽器的數(shù)據(jù),所以瀏覽器最好是有效數(shù)據(jù)頁面),在程序中修改的XPath語句,不會保存到INI文件中,請自行手工保存。

如果列表中數(shù)據(jù)無誤,預(yù)覽窗口中的Docx模板內(nèi)容也正確,則可以點擊創(chuàng)建文檔按鈕,填寫要生成的文件名,本軟件會使用抓取到的網(wǎng)頁數(shù)據(jù)替換模板中的索引字符串,自動生成Docx文檔。

需要說明的是,右下角的Docx預(yù)覽窗口不能完整的支持Word文檔,對不標(biāo)準(zhǔn)的文檔可能會出現(xiàn)文本缺失或者錯位現(xiàn)象。遇到這種情況,可以忽略,或者將模板文件改成規(guī)范的文本格式(單倍行距)。

XPath語句的獲取辦法

通常我們可以使用谷歌的Chrome瀏覽器打開網(wǎng)站頁面,按F12調(diào)出開發(fā)者工具界面,在ELements選項卡下,隨著鼠標(biāo)的移動可以看到網(wǎng)頁內(nèi)容被陰影覆蓋,點開三角符號,可以更進一步定位準(zhǔn)確的位置,直到找到最終需要的數(shù)據(jù)位置。在找到的文本上點鼠標(biāo)右鍵,在彈出的菜單中,選擇Copy-CopyXPath,然后粘貼到記事本即可得到需要的XPath語句。

這里需要說明一點:如果拷貝出來的XPath語句中有/tbody會影響采集,程序內(nèi)部對此問題進行了處理,但可能會在某些特殊情況下還是會影響數(shù)據(jù)采集,可以手工去掉。

應(yīng)用信息

其他版本

猜你喜歡

    熱門評論

    最新評論

    發(fā)表評論查看所有評論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字數(shù): 0/500 (您的評論需要經(jīng)過審核才能顯示)
    久久精品re老司机| 欧美五月丁香网| 久久道一本爱一区二区| 一区二区三区亚洲精品国| AV狠狠色超碰丁香婷婷综合久久| 人伦片无码双飞| 午夜a一级| 精品人妻在线啪| 中文字幕AV电影| 69尤物天堂.com| 亚洲成人小电影网站| 最近成人无码视频| 精品偷拍被偷拍在线观看| 亚洲国产欧美国产综合一区| 综合色图亚洲| 欧美色综合50pp| 亚洲色图色就是色| 国产黄色大片在线播放| 亚洲综合网站色欲色欲| 操碰人妻| 你懂的www.填空| 你懂的网站黄| 老妇人一级毛片| 最新无码a∨在线观看| 人妻区| 久久精品久久三| 日韩一级大片A级免费| 日韩免费三级电影不卡| 国产农村乱子伦精品视频| 手机看片一区二区| 日韩久久九九精品视频| 六月色综合久| 在线免费观看学生妹| 天天干网| 国产妇女精品| 视频专区国产精品伊人| 黄V网站大全| 丰满久久宗合| 真实的单亲乱对白| 欧美日韩不卡合集视频| 九九精品影院毛片|