これは私のコードです。URLからページタイトルを取得するためにGroovyで書いたコードです。しかし、私が "Moved Permanently"と書いたウェブサイトの中には、301リダイレクトが原因であると思うものがあります。私はこれを避けるために、私が代わりに正しいページタイトル http://www.nytimes.com/2011/08/14/arts/music/jay-z-and-kanye-wests-watch-the-throne.htmlHttpUrlConnectionはコンテンツのタイトルを取得し、「Moved Permanently」を取得しました
def con = (HttpURLConnection) new URL(url).openConnection()
con.connect()
def inputStream = con.inputStream
HtmlCleaner cleaner = new HtmlCleaner()
CleanerProperties props = cleaner.getProperties()
TagNode node = cleaner.clean(inputStream)
TagNode titleNode = node.findElementByName("title", true);
def title = titleNode.getText().toString()
title = StringEscapeUtils.unescapeHtml(title).trim()
title = title.replace("\n", "");
return title
私はそれを試みましたが、それでも動作しませんでした。私はsetInstainceFollowRedirects(true)はデフォルトだと思います。しかし、お返事いただきありがとうございます。 – toy
ええ、私は投稿する前に自分自身を試していたはずです。私はあなたの症状を再現しましたが、なぜその理由が分かりません。私はHttpUrlConnectionの代わりにHttpBuilderを試してみました。それはadditonal設定なしのリダイレクトに従っています。しかし、結果のコンテンツをHtmlCleanerに渡すことはできませんでした。 – mmigdol
物事に影響を与えているのはどうでもいいのですか? –