準備第三方插件
HtmlAgilityPack 在nuget中可以找到并下載 然后在項目中引用
代碼步驟
從指定網站把網頁的html獲得
WebRequest request = WebRequest.Create("http://www.hnzbcg.com.cn/hnzbcg/cgxx/cggg/A080302index_1.htm"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); string s = reader.ReadToEnd();
將獲得的html字符串傳入 這個插件的具體使用可以參考http://www.cnblogs.com/GmrBrian/p/6201237.html
HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(s); HtmlNode div = doc.DocumentNode.SelectSingleNode("http://a[@class='GrayLink12']"); HtmlNodeCollection hrefList = doc.DocumentNode.SelectNodes("http://a[@class='GrayLink12']"); List<string> list = new List<string>();