c#打开浏览器并全屏设置ie浏览器打开全屏 _经验知识

基于C#.NET+Phantomjs+Sellenium的高级网络爬虫程序。可执行javascript代码、触发各类事件、操纵页面Dom结构、甚至可以移除不喜欢的css样式。
很多网站都用Ajax动态加载、翻页。比如携程网的评论数据。如果是用之前那个简单的爬虫。是很难直接抓取到所有评论数据的。我们需要去分析那漫天的Javascript代码寻找API数据接口。还要时刻提防对方增加数据陷阱或修改API接口地。
如果通过高级爬虫。就可以完全无视这些问题。无论他们如何加密Javascript代码来隐藏API接口。最终的数据都必要呈现在网站页面上的Dom结构中。不然普通用户也就没法看到了。所以我们可以完全不分析API数据接口。直接从Dom中提取数据。甚至都不需要写那复杂的正则表达式。
主要特性支持Ajax请求事件的触发及捕获；
支持异步并发抓取；
支持自动事件通知；
支持代理切换;
支持操作Cookies；
运行截图抓取酒店数据
抓取评论数据
示例代码【c#打开浏览器并全屏设置ie浏览器打开全屏】///<summary>///抓取酒店评论///</summary>staticvoidMain(string[]args){varhotelUrl="http://hotels.ctrip.com/hotel/434938.html";varhotelCrawler=newStrongCrawler();hotelCrawler.OnStart+=(s,e)=>{Console.WriteLine("爬虫开始抓取地址："+e.Uri.ToString());};hotelCrawler.OnError+=(s,e)=>{Console.WriteLine("爬虫抓取出现错误："+e.Uri.ToString()+" 。异常消息："+e.Exception.ToString());};hotelCrawler.OnCompleted+=(s,e)=>{HotelCrawler(e);};varoperation=newOperation{Action=(x)=>{//通过Selenium驱动点击页面的“酒店评论”x.FindElement(By.XPath("//*[@id='commentTab']")).Click();},Condition=(x)=>{//判断Ajax评论内容是否已经加载成功returnx.FindElement(By.XPath("//*[@id='commentList']")).Displayed&&x.FindElement(By.XPath("//*[@id='hotel_info_comment']/div[@id='commentList']")).Displayed&&!x.FindElement(By.XPath("//*[@id='hotel_info_comment']/div[@id='commentList']")).Text.Contains("点评载入中");},Timeout=5000};hotelCrawler.Start(newUri(hotelUrl),null,operation);//不操作JS先将参数设置为NULLConsole.ReadKey();}github：https://github.com/microfisher/Strong-Web-Crawler

c#打开浏览器并全屏设置ie浏览器打开全屏

推荐阅读

95号汽油贵多少钱哪个汽油贵

坏消息|坏消息，红米K50不支持屏下镜头，好消息是超大杯支持！

黑千金小说主要讲了哪些内容

ab胶和52哪个好 ab胶怎么去除

违章代码50112是什么意思

品色是什么

不能抵押的不动产是什么

不谈激励制度聊管理都是耍流氓

851型号墨盒计数器清零方法详解

孟晚舟为何姓孟而不是姓任？

开心果孕妇可以吃吗

五的读音五的意思

新15元黄鹤楼香烟图黄鹤楼香烟15元一包的

什么样的男人容易做备胎？

Win11安装黑屏了 Win11黑屏怎么办？

郑州社保可以补缴吗?2020社保补缴条件有哪些? 郑州社保可以补缴吗

美美咖APP软件简单使用讲解

白夜追凶的结局怎么样白夜追凶的结局

为什么都买山姆小青柠汁

土豆开始长芽了还能吃吗,土豆发芽后还能吃吗？

c#打开浏览器并全屏 设置ie浏览器打开全屏

推荐阅读

c#打开浏览器并全屏设置ie浏览器打开全屏