반응형
파이썬을 사용하여 웹 페이지에 로그인하고 나중에 사용할 쿠키를 검색하는 방법은 무엇입니까?
파이썬을 사용하여 웹 페이지를 다운로드하고 구문 분석하고 싶지만, 액세스하려면 쿠키 세트가 몇 개 필요합니다.그래서 먼저 https를 통해 웹페이지에 로그인해야 합니다.로그인 순간에는 /login.php에 두 개의 POST 매개 변수(사용자 이름, 암호)를 보내는 작업이 포함됩니다.로그인 요청 중에 응답 헤더에서 쿠키를 검색하여 저장하여 웹 페이지 /data.php 다운로드 요청에 사용할 수 있도록 합니다.
파이썬(바람직하게는 2.6)에서 어떻게 해야 합니까?가능하다면 내장 모듈만 사용하고 싶습니다.
Excellent Requests 라이브러리를 사용하는 버전은 다음과 같습니다.
from requests import session
payload = {
'action': 'login',
'username': USERNAME,
'password': PASSWORD
}
with session() as c:
c.post('http://example.com/login.php', data=payload)
response = c.get('http://example.com/protected_page.php')
print(response.headers)
print(response.text)
import urllib, urllib2, cookielib
username = 'myuser'
password = 'mypassword'
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'username' : username, 'j_password' : password})
opener.open('http://www.example.com/login.php', login_data)
resp = opener.open('http://www.example.com/hiddenpage.php')
print resp.read()
resp.read()
열려는 페이지의 직선 html이며 사용할 수 있습니다.opener
세션 쿠키를 사용하여 페이지를 봅니다.
언급URL : https://stackoverflow.com/questions/189555/how-to-use-python-to-login-to-a-webpage-and-retrieve-cookies-for-later-usage
반응형
'programing' 카테고리의 다른 글
Firebase에서 index.html 파일을 실행하지 않음 (0) | 2023.07.17 |
---|---|
사전 대 객체 - 어떤 것이 더 효율적이고 왜? (0) | 2023.07.17 |
Django 템플릿 내 인덱스별 참조 목록 항목? (0) | 2023.07.17 |
참 조건(x = x ?: 1)에 대한 값을 할당하지 않고 3진수 연산자를 사용하는 이유는 무엇입니까? (0) | 2023.07.17 |
공백 없이 텍스트를 단어 목록으로 분할하는 방법 (0) | 2023.07.17 |