java通过url获取网页内容_java通过url获取网页内容

在java中，一个url的简单小应用，就是通过url爬取网页的内容。在这里会遇到一个小问题，如果是服务器端禁止抓取，会在控制台报 HTTP 403错误代码。例如CSDN博客网站java.io.IOException: Server returned HTTP response code: 403 for URL:解决方法：可以通过设置User-Agent来欺骗服务器。httpUrlConn.set

weixin_35808698

2381人浏览 · 2021-02-13 04:38:00

weixin_35808698 · 2021-02-13 04:38:00 发布

在java中，一个url的简单小应用，就是通过url爬取网页的内容。

在这里会遇到一个小问题，如果是服务器端禁止抓取，会在控制台报 HTTP 403错误代码。例如CSDN博客网站

java.io.IOException: Server returned HTTP response code: 403 for URL:

解决方法：

可以通过设置User-Agent来欺骗服务器。

httpUrlConn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");

全部代码如下：

package cn.edu.ldu.socket;

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.net.HttpURLConnection;

import java.net.MalformedURLException;

import java.net.URL;

public class Test {

public static void main(String[] args) {

try {

//建立连接

URL url = new URL("http://blog.csdn.net/HLK_1135");

HttpURLConnection httpUrlConn = (HttpURLConnection) url.openConnection();

httpUrlConn.setDoInput(true);

httpUrlConn.setRequestMethod("GET");

httpUrlConn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");

//获取输入流

InputStream input = httpUrlConn.getInputStream();

//将字节输入流转换为字符输入流

InputStreamReader read = new InputStreamReader(input, "utf-8");

//为字符输入流添加缓冲

BufferedReader br = new BufferedReader(read);

// 读取返回结果

String data = br.readLine();

while(data!=null) {

System.out.println(data);

data=br.readLine();

}

// 释放资源

br.close();

read.close();

input.close();

httpUrlConn.disconnect();

} catch (MalformedURLException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

原文链接:https://blog.csdn.net/HLK_1135/article/details/53968002

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

AI PPT免费使用技巧盘点：如何快速制作专业PPT？

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手