import java.net.*;
import java.io.*;

public class urlconnection
{
    public static void main(String[] args)
    {
        StringBuffer document = new StringBuffer();
        try
        {
            URL url = new URL("http://www.163.com");
            URLConnection conn = url.openConnection();
            BufferedReader reader = new BufferedReader(new InputStreamReader(conn.getInputStream()));
            String line = null;
            while ((line = reader.readLine()) != null)
            document.append(line + " ");
            reader.close();
        }
        catch (MalformedURLException e)
        {
            e.printStackTrace();
        }
        catch (IOException e)
        {
            e.printStackTrace();
        }
        System.out.println(document.toString());
    }
}
==========================================================
方法二：
==========================================================
import java.net.*;
import java.io.*;

public class useSourceViewer
{
    public static void main (String[] args)
    {
        if (args.length > 0)
        {
            try
            {

URL u = new URL(args[0]);
InputStream in = u.openStream( );

in = new BufferedInputStream(in);

                Reader r = new InputStreamReader(in);
                int c;
                while ((c = r.read( )) != -1)
                {
                    System.out.print((char) c);
                }
                Object o = u.getContent( );
                System.out.println("I got a " + o.getClass().getName( ));
            }
            catch (MalformedURLException e)
            {
                System.err.println(args[0] + " is not a parseable URL");
            }
            catch (IOException e)
            {
                System.err.println(e);
            }
        }
    }
}

posted on 2008-07-13 20:38 aisoft 阅读(10474) 评论(5) 编辑收藏所属分类: J2EE开发技术

FeedBack:

# re: Java 读取网页Html文件[未登录]

2008-07-14 20:17 | javaread.com

如果要获取网页文本内容，还可以配合htmlparser 回复更多评论

# re: Java 读取网页Html文件

2008-08-18 19:36 | qq630202528

怎么读取源文件中【和】之间的内容？回复更多评论

# re: Java 读取网页Html文件[未登录]

2009-04-13 21:29 | GreatGhoul

还是第一种方法好用. 回复更多评论

# re: Java 读取网页Html文件

2010-12-30 16:07 | 路人

这个方法是会出错的，((line = reader.readLine()) != null 是可能出错，有可能网页没有读取完成就遇见这样的空行本人亲自测试遇见过回复更多评论

# re: Java 读取网页Html文件

2011-12-10 15:27 | XU

比较喜欢第一种方法回复更多评论

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: 转:Java对图片的处理---缩放图像、图像切割、图像类型转换、彩色转为黑白 js获取jsp中URL传递的参数 JAVA 数字签名(转载) Hibernate应该如何配置Access数据库。 Java 读取网页Html文件

2008年7月

日

一

二

三

四

五

六

随笔档案(2)

文章分类(12)

文章档案(12)

收藏夹

JAVA EE

随笔档案(2)

文章分类(12)

文章档案(12)

收藏夹

搜索

最新评论