2013年10月28日 星期一

抓取"檢視原始檔"內容。如何使用C#抓取網頁"真正"的本文



        public static string RdData()
        {
            string strUrl = "http://www.taoyuan.com/up/flxxxtx/AA.htm";

            HttpWebRequest request = (HttpWebRequest)WebRequest.Create(strUrl);

            HttpWebResponse webresponse = (HttpWebResponse)request.GetResponse();

            StreamReader streamReader = new StreamReader(webresponse.GetResponseStream(),
                               Encoding.GetEncoding("big5")); //可改不同編碼

            string 原始碼 = streamReader.ReadToEnd();

            return 原始碼;
        }

完畢。


筆記:
  • webBrowser.Document.Body.InnerHtml 是修改過後的本文(多了<TBODY>)
  • 使用HttpWebRequest即可抓取原始檔. 

沒有留言:

張貼留言