Jsoup解析网址与浏览器查看内容不一致 -

luo476979657

浏览: 60202 次
性别:
来自: 成都

最近访客更多访客>>

xcw931924821

zhutiehan

sf_dream

neolance

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Jsoup解析网址与浏览器查看内容不一致

博客分类：

java问题集

开发过程中，用Jsoup解析糯米团购网站页面的时候，发现取得的页面和浏览器查看到的页面不一样，而是手机页面。

程序代码如下：

1	`content = Jsoup.connect("http://www.nuomi.com").timeout(6000).get();//取得整个页面内容；`

经过跟踪代码执行，发现content取得的内容和用浏览器直接访问的内容不一样。

经过查询资料，发现是User-Agent 的问题，在Jsoup中默认没有指定User-Agent，网站的服务器则认为这个访问来自手机，返回的是手机的页面。

将User-Agent加入到Jsoup中，问题解决。

代码如下：

content = Jsoup.connect(url)

          .userAgent("Mozilla/4.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)") 

          .timeout(6000).get();//取得整个页面内容；

以上代码是模拟的IE9的User-Agent信息，下面是各个版本浏览器的User-Agent信息。

IE6：Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)

IE7：Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 6.0)

IE8：Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)

IE9：Mozilla/4.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)

Maxthon：Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.12 (KHTML, like Gecko) Maxthon/3.0 Chrome/22.0.1229.79 Safari/535.12

Firefox：Mozilla/5.0 (Windows NT 5.1; zh-CN; rv:1.9.1.3) Gecko/20100101 Firefox/8.0

Chrome：Mozilla/5.0 (Windows NT 5.1; zh-CN) AppleWebKit/535.12 (KHTML, like Gecko) Chrome/22.0.1229.79 Safari/535.12

Opera：Opera/9.99 (Windows NT 5.1; U; zh-CN) Presto/9.9.9

Safari：Mozilla/5.0 (Windows NT 5.1; zh-CN) AppleWebKit/535.12 (KHTML, like Gecko) Version/5.0.1 Safari/535.12

分享到：

缓存学习网站 | 在MyEclipse中安装Freemarker插件

2014-03-19 08:03
浏览 4769
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Jsoup解析网址与浏览器查看内容不一致

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Jsoup解析网址与浏览器查看内容不一致

评论

发表评论

相关推荐

Quartz实现动态定时任务

Zelix KlassMaster(ZKM) java代码混淆软件使用指南

windows设置nginx服务

org.springframework.context.NoSuchMessageException:错误

总结整理时下流行的浏览器User-Agent大全

解决struts2+spring+ibatis2,Property 'sqlMapClient' is required

Freemarker的国际化及使用JSTL

spring中使用logback日志组件替换log4j

Tomcat 安装服务失败，错误信息NonAlpha 45

如何将解压缩版的tomcat加入windows系统服务

设置Tomcat的JAVA_OPTS参数

运行期从ibatis配置文件中获取sql 的两种方法

slf4j + logback使用

基于Apache和多实例Tomcat（独立JVM）的虚拟主机方案

cookie实现自动登陆(2)

cookie实现自动登陆(1)

彻底删除JDK

最近访客更多访客>>