公交车上荫蒂添的好舒服的电影-公用玩物(np双xing总受)-公用小荡货芊芊-公与妇仑乱hd-攻把受做哭边走边肉楼梯play-古装一级淫片a免费播放口

LOGO OA教程 ERP教程 模切知識交流 PMS教程 CRM教程 開發(fā)文檔 其他文檔  
 
網(wǎng)站管理員

Asp.net/C#網(wǎng)頁數(shù)據(jù)采集

admin
2021年1月29日 18:17 本文熱度 3595

    早在以前就聽說過數(shù)據(jù)采集這個神奇的功能,當(dāng)時對這個是多么的奢望啊。 ~00~,后來想要給自己開個采集的網(wǎng)站,就想到了整個電影的采集站。

    在好奇的動力下,開始瘋狂的查閱以及學(xué)習(xí)關(guān)于網(wǎng)頁采集,數(shù)據(jù)采集等相關(guān)信息。不過網(wǎng)上大部都是asp的和php的,關(guān)于.net的很少。無奈之下只要硬著頭皮學(xué)習(xí)。經(jīng)過幾天的努力,最終還是給我研究出來了。心里還是挺高興的襖。其實(shí)網(wǎng)頁采集也沒有用到什么高深的技術(shù),都是些普普通通的技術(shù),只不過效果比較神奇,就會讓人感覺到整個都比較深奧,如果你想學(xué)習(xí).net的數(shù)據(jù)采集,以及思路,那么請看完。

    數(shù)據(jù)采集大體可以分為兩部曲:

一部曲:

          因?yàn)橐杉瘎e人網(wǎng)頁上的內(nèi)容,所有我們先要得到要采集網(wǎng)頁上的html代碼,獲取html代碼還是比較簡單。利用WebClient的DownloadData(url)得帶byte數(shù)組,然后在轉(zhuǎn)換成string字符串。

          具體代碼如下:

        /// <summary>

        /// 獲取網(wǎng)頁源代碼

        /// </summary>

        /// <param name="url">URL路徑</param>

        /// <param name="encoding">編碼方式</param>

        public string GetHTML(string url, string encoding)

        {

            WebClient web = new WebClient();

            byte[] buffer = web.DownloadData(url);

            return Encoding.GetEncoding(encoding).GetString(buffer);

        }

二部曲:

        現(xiàn)在我們得到了目標(biāo)網(wǎng)頁的html代碼,那么我們就開始時得扣取我們想要的數(shù)據(jù)??廴?shù)據(jù)無疑就要用到強(qiáng)大的正則表達(dá)式了。利用正則表達(dá)式的匹配來獲取我們要的內(nèi)容,這里可以過濾掉制定的html代碼,剩下的就是內(nèi)容了。

具體代碼如下:

        Html html = new Html();

        //得到指定頁面的html代碼,第一個參數(shù)為url(貌似都知道),第二個是目標(biāo)網(wǎng)頁的編碼集

        string htmlCode = html.GetHTML("http://gvod.tom59.cn/List.asp?ClassId=3", "gb2312");

        //正則表達(dá)式

        Regex regexarticles = new Regex("<td\\s+height=\"\\d+\"><a\\s+href=\".+DataId=(?<id>\\d+)\"\\s+target=\"_blank\">(?<title>.+)</a>.*</td>");

        //所有匹配表達(dá)式的內(nèi)容

        MatchCollection marticles = regexarticles.Matches(htmlCode);

        ///遍歷匹配內(nèi)容

        foreach (Match m in marticles)

        {

             Console.Write("標(biāo)題:" + m.Groups["title"].Value+"\n");

             Console.Write("id:" + m.Groups["id"].Value + "\n");

             Console.Write("\n");

}

以上就是采集數(shù)據(jù)的核心代碼,關(guān)于正則表達(dá)式我在這里就不詳細(xì)講解了(其實(shí)正則表達(dá)式我也是菜鳥哈)。


該文章在 2021/1/29 18:17:01 編輯過
關(guān)鍵字查詢
相關(guān)文章
正在查詢...
點(diǎn)晴ERP是一款針對中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國內(nèi)大量中小企業(yè)的青睞。
點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場、車隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報(bào)表等業(yè)務(wù)管理,結(jié)合碼頭的業(yè)務(wù)特點(diǎn),圍繞調(diào)度、堆場作業(yè)而開發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體,是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。
點(diǎn)晴WMS倉儲管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質(zhì)期管理,貨位管理,庫位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號管理軟件。
點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi),不限功能、不限時間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。
Copyright 2010-2025 ClickSun All Rights Reserved

主站蜘蛛池模板: 国产成人yy精品1024在线 | 国产成人亚洲精品无码电影不卡 | 99久久久久精品一级毛片 | 国产在线精品一区二区三区直播 | 东京热无码av一区二区 | 国产日韩美国成人 | 国产在线91精品天天更新 | 国产高潮流白浆喷水在线观看 | 国产亚洲欧美日韩精品一区二区 | 国产午夜亚洲精品一级 | 国产小视频你懂的在线欧美 | 91精品国产免费青青碰在线观看 | 国产精品高清免费网站 | 91国内揄拍国内精品情侣对白 | 国产在线精品成人一 | 精品国产片免费在 | 国产一区二区三区视频在线观看 | 国产午夜亚洲精品一级在线 | 国产秘精品入口免费软件 | 国产精品柳州莫菁 | 国产在线观看精品不卡 | 国产午夜成人免费看片无遮挡 | 国产熟女露脸 | 国产福利一区二区三区在线观 | 91嫩草国产线观看免费永久 | 国产亚洲3p无码一区 | 国产精品白丝喷水在线观看者相 | 国产高清无码日韩一二三区 | 国产成人91青青草原精品 | 国产精品麻豆va在线播放 | 国产成人综合亚洲色就色 | 97人妻无码公开免费视频 | 97亚洲综合色成在线观看 | 国产精品欧美日韩一区 | 国产午夜福利在线播放 | 成人免费观看高清视频a斤 成人免费观看国产高清 | 国产精品久久久久久久久久影院 | 国产成人污污网站在线观看 | 国精产品一二二线精东 | 91大神在线精品播放 | 国产亚洲成人精品久久久久无码av |