元ソース。
Source source = new Source(new URL("http://www.example.com"));
Accept-Encoding からはずせばいいのかもしれないが、HttpClient も使用しているため、そちらで対応することに。
HttpClient http = new DefaultHttpClient();
HttpResponse res = http.execute(new HttpGet(URI.create("http://www.example.com")));
if (res.getStatusLine().getStatusCode() != HttpStatus.SC_OK)
{
LOG.error("Failed to load uri.");
return false;
}
InputStream in = res.getEntity().getContent();
if (res.getHeaders("Content-Encoding").length > 0 &&
"gzip".equals(res.getHeaders("Content-Encoding")[0].getValue()))
in = new GZIPInputStream(in);
Source source = new Source(in);
Jericho HTML だけで対処出来る方法があればいいのだが。compress, deflate は未対応・・・
文字化けしたので、続き
0 件のコメント:
コメントを投稿