私は、POSTログイン認証が必要なウェブサイトをスクラップしようとしています。最初のリクエストでは正常に認証できますが、戻って次のページにアクセスしようとすると、ログインページにリダイレクトされます(基本的にはログインしていないということです)。HttpWebRequestを使用して複数のページにアクセスする
コード:
Public Function GetPage(ByVal PageName As String, ByVal UserName As String, ByVal Password As String) As String
Dim ReturnString As String = ""
Dim Cookies As New CookieContainer
Dim AuthURI As Uri = New Uri(AuthURL)
Cookies.GetCookieHeader(AuthURI)
Cookies.GetCookies(AuthURI)
'Set Header/Meta Info
System.Net.ServicePointManager.SecurityProtocol = SecurityProtocolType.Ssl3
Dim request As HttpWebRequest = HttpWebRequest.Create(AuthURL)
request.Method = "POST"
request.CookieContainer = Cookies
request.UserAgent = "Mozilla/5.0 (Windows; U;Windows NT 5.1; en-US; rv:1.8.1.1) Gecko/20061204 Firefox/2.0.0.1"
'Set POST Info
Dim postData As String = "userName=" & HttpUtility.UrlEncode(UserName) & "&password=" & HttpUtility.UrlEncode(Password)
Dim byteArray As Byte() = Encoding.UTF8.GetBytes(postData)
request.ContentType = "application/x-www-form-urlencoded"
request.ContentLength = byteArray.Length
'Write to the request stream
Dim dataStream As Stream = request.GetRequestStream()
dataStream.Write(byteArray, 0, byteArray.Length)
dataStream.Close()
' Get the response.
Dim response As HttpWebResponse = request.GetResponse()
dataStream = response.GetResponseStream()
Dim reader As New StreamReader(dataStream)
Dim responseFromServer As String = reader.ReadToEnd()
ReturnString = responseFromServer
'Append cookie data
For Each c As Cookie In response.Cookies
Cookies.Add(c)
Next
' Clean up the streams.
reader.Close()
dataStream.Close()
response.Close()
'Bail on fail
If ReturnString.Contains("Login failed") Then Return Nothing
'Generate new request
request = HttpWebRequest.Create(URLStub & PageName)
request.Method = "POST"
request.UserAgent = "Mozilla/5.0 (Windows; U;Windows NT 5.1; en-US; rv:1.8.1.1) Gecko/20061204 Firefox/2.0.0.1"
request.CookieContainer = Cookies
'Set POST Info
postData = "userName=" & HttpUtility.UrlEncode(UserName) & "&password=" & HttpUtility.UrlEncode(Password)
byteArray = Encoding.UTF8.GetBytes(postData)
request.ContentType = "application/x-www-form-urlencoded"
request.ContentLength = byteArray.Length
'Write to the request stream
dataStream = request.GetRequestStream()
dataStream.Write(byteArray, 0, byteArray.Length)
dataStream.Close()
'Get the response.
response = request.GetResponse
dataStream = response.GetResponseStream
reader = New StreamReader(dataStream)
responseFromServer = reader.ReadToEnd
ReturnString = responseFromServer
'Clean up the streams.
reader.Close()
dataStream.Close()
response.Close()
Return ReturnString
End Function
このコードはPHPで書かれている別のページを模倣します。 PHPコードページが動作し、PHPバージョンと同じURLを使用しています。そのため、問題がサーバー側にないことを約99%確信しています。
また、私はこの問題に関して他の投稿を精査しました。はと表示されています。私は文法的に正しいことをすべて行っていますが、おそらく私は何か小さくて愚かなものを逃していますか?
アイデア?私は今数日間これを戦ってきた。前もって感謝します。 :)
EDIT:私はセッションクッキーでプレーしてきたし、最初のログオンと実際の要求とを比較しています。ここで私が持っているものです:
FIRST:
ORA_WX_SESSION: "1FAA2AB1EF40DF4BC291DD3326F1DC3C596F56CF-2#3"
JSESSIONID: a2c38b128e1e54051a2c95c5a3a1e3a4cb0cb5b7ba74cd260aaec531856d722f.e34SahmMbNaMe34Sa3yPaN8Sc40
XYZCustomerServiceUserName: (login-name)
XYZ: d53f8dcd87b861a61d99ac21ec53bb2b
LAST:
ORA_WX_SESSION: 1FAA2AB1EF40DF4BC291DD3326F1DC3C596F56CF-2#3
JSESSIONID: a2c38b128e1e54051a2c95c5a3a1e3a4cb0cb5b7ba74cd260aaec531856d722f.e34SahmMbNaMe34Sa3yPaN8Sc40
私は二つのことに気づく...まず、ORA_WX_SESSIONは(私は戻って、応答と要求の間でそれらを強制しようとしていても)それから取り除かその引用符を持っています。また、XYZCustomerServiceUserName値とXYZ値も取り除かれます。それ以外のセッション情報は、2回の接続試行の間で同じです。
私はあなたがピックアップしていないという応答で何かが戻ってくると思います。 – Paparazzi