博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
c# 抓取 js动态生成的HTML的工具:NHtmlUnit‎
阅读量:6860 次
发布时间:2019-06-26

本文共 1315 字,大约阅读时间需要 4 分钟。

hot3.png

c# 抓取 js动态生成的HTML的工具:NHtmlUnit‎ 博客分类: c#

官方地址:

编译获取dll方法:

1.下载 (nuget所在网站:http://www.nuget.org/)

2.打开DOS命令对话框,

 进入nuget.exe文件所在目录(我的exe文件放在桌面)

 

3.运行命令安装NHtmlUnit,安装后会在当前目录创建两个文件夹,一个是安装所需环境IKVM,另一个就是需要的NHtmlUnit文件夹,里面的lib目录下面有生成的dll

运行命令:nuget install NHtmlUnit

 

3.使用方法可以去HtmlUnit的官方网站阅读文档,或在博客园搜索教程,与JAVA的HtmlUnit的用法是一样的,NHtmlUnit只是

在HtmlUnit上加了个壳使.net可以调用JAVA而已。

 

实例代码(引用dll:HtmlUnit,NHtmlUnit,为了偷懒,我把所有IKVM的dll都引用了):

复制代码
class Program    {        static void Main(string[] args)        {            WebClient client = new WebClient();            client.Options.JavaScriptEnabled = false;            client.Options.CssEnabled = true;            client.Options.ThrowExceptionOnScriptError = false;            client.Options.Timeout = 5000;            HtmlPage page = client.GetHtmlPage("http://www.baidu.com/#wd=11&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&rsv_sug3=2&rsv_sug2=0&inputT=26");            Thread.Sleep(3000);            string xml = page.AsXml();            HtmlDocument doc = new HtmlDocument();//忽略此类,这个类是其他DLL提供的,与NHtmlUnit无关            doc.LoadHtml(xml);            string nodeName = doc.GetElementbyId("container").Name;            Console.WriteLine("\r\n\r\n\r\n\r\n" + nodeName + "\r\n\r\n\r\n\r\n" );            Console.Read();        }    }
复制代码

 

转载于:https://my.oschina.net/xiaominmin/blog/1597634

你可能感兴趣的文章
我的前端2019面试指引
查看>>
iOS热更新实现方式
查看>>
创建型模式 工厂模式
查看>>
最新安装CocoaPods教程
查看>>
Swizzling Method
查看>>
React同构踩坑记录
查看>>
教你用Python如何实现微信自动回复功能,机器人自动对话!
查看>>
使用var定义变量和不使用的区别
查看>>
React两个bug踩坑
查看>>
vue引入mxGrpah
查看>>
合并冲突 - 每天三分钟玩转Git(三)
查看>>
你们公司今年会发年终奖吗?Python告诉你大家怎么说
查看>>
Derek解读Bytom源码-Api Server接口服务
查看>>
Java之JDK7的新语法探索
查看>>
微软大秀Windows 10中的MyOffice App免费功能
查看>>
UDP协议
查看>>
学jstl,看这一篇就够了
查看>>
Webpack之tapable深入学习(一)--Sync*Hook
查看>>
Redis 环境配置,缓存必备
查看>>
设计模式 系列记忆之 六大设计原则
查看>>