웹 페이지가 언제 마지막으로 업데이트되었는지 어떻게 알 수 있습니까?
웹 페이지가 변경된 후 시간이 얼마나 지 났는지 확인할 수있는 방법이 있습니까?
예를 들어 다음에서 호스팅되는 페이지가 있습니다. www.mywebsitenotupdated.com
이 html 페이지가 언제 서버에 업로드 알 수있는 방법이 있습니까?
매우 중요한 서버에 대한 액세스 권한이있는 것입니다. 웹 페이지에 대한 링크입니다.
아니요, 페이지에 액세스하는 것이지만 페이지가 마지막으로 업데이트되거나 마지막으로 변경되거나 서버에 업로드 된시기 (해석에 따라 세 가지가 다를 수 있음)를 알 수 없습니다.
서버는 (HTTP 1.1 프로토콜에 따라) Last-Modified
헤더를 보낼 수 있습니다. 예를 들어 Rex Swain의 HTTP 뷰어를 사용하여 여러 방법으로 확인할 수 있습니다. . 그러나 프로토콜에 따르면 이것은 단지 "원 서버가 변형이 마지막으로 수정한다고 믿는 날짜와 시간"입니다. 그리고 프로토콜은 현실적으로 다음과 같이 추가합니다.“이 헤더 필드의 정확한 의미는 원본 서버의 구현과 원본 리소스의 특성에 따라 추가합니다. 파일의 경우 파일 시스템이 마지막으로 수정 된 시간이 있습니다. 동적으로 포함 된 부품이있는 경우에 해당 구성 요소에 대한 마지막 수정 시간 집합 중 가장 최근일 수 있습니다. 데이터베이스 게이트웨이의 경우 레코드의 마지막 업데이트 타임 스탬프 일 수 있습니다. 가상 개체의 경우 내부 상태가 마지막으로 변경 될 수 있습니다.”
웹 페이지 생성은 콘텐츠 관리 시스템 등에서 동적으로 생성되는 경우 많으며, 일반적으로 Last-Modified
요청 시간과 매우 가까운 응답 데이터 스탬프가 표시됩니다. 이는 경우에만 헤더가 의미합니다.
"정적"페이지 (서버는 요청과 일치하는 파일을 선택하여 전송)의 경우에도 Last-Modified
날짜 스탬프는 일반적으로 서버의 파일에 대한 마지막 쓰기 액세스 만 나타냅니다. 이는 백업 복사본에서 파일이 복원 된 시간 또는 콘텐츠를 변경하지 않고 서버에서 파일을 편집 한 시간 또는 이전 파일을 대체 할 수있는 서버에 업로드 된 시간과 관련이 있습니다. 동일한 사본. 이 경우 타임 스탬프가 기술적으로 말하는 시간을 나타냅니다 (반드시 마지막 변경 시간은 아님).
브라우저 콘솔 ( ? )을 열고 다음을 입력 입력하십시오.
javascript:alert(document.lastModified)
일부 경우에 유용 할 수있는 페이지 업데이트를 찾는 또 다른 방법이 있습니다 (작동하는 경우 :).
페이지가 구글 또는 뒤로 기계에 의해 색인이 생성 된 경우 해당 페이지에서 저장 한 날짜를 확인할 수 있습니다 (이 방법은 어떤 페이지에서도 작동하지 않으며 몇 가지 제한 사항이 있으며 광범위하게 조사됩니다 .이 webmasters.stackexchange 질문의 답변에 있습니다.하지만 대부분의 경우 페이지 업데이트 날짜를 찾는 데 도움이 될 수 있습니다.
- Google 방식 : 링크로 이동 https://www.google.com.ua/search?q=site%3Awww.example.com&biw=1855&bih=916&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000%2Ccd_max% 3A 및 tbm =
- 원하는 페이지 URL로 검색 필드의 텍스트를 설명 수 있습니다.
- 예를 들어, 현재 stackoverflow 질문 페이지 검색은 2014 년 5 월 14 일 결과로 질문 생성을 제공합니다.
- 웨이 백 머신 방식 : 링크로 이동 https://web.archive.org/web/*/www.example.com
Last Modified
헤더 를 확인 하십시오 ( 문서 )를 사용할 수 있습니다 .httpie
설치
pip install httpie --user
용법
$ http -h https://martin-thoma.com/author/martin-thoma/ | grep 'Last-Modified\|Date'
Date: Fri, 06 Jan 2017 10:06:43 GMT
Last-Modified: Fri, 06 Jan 2017 07:42:34 GMT
은 Date
이 서버의 time-이 아닌 해당 지역의 time-을보고으로 중요하다. 모든 서버가 또한 전송하는 Last-Modified
[해석] 아닙니다 (예 : 유저가 수퍼 전송 하지 않는을 구석으로 같습니다).
https://gist.github.com/EronHennessey/6996195 에서이 작업을 수행하는 수행적인 방법
import httplib
import yaml
c = httplib.HTTPConnection(address)
c.request('GET', url_path)
r = c.getresponse()
# get the date into a datetime object
lmd = r.getheader('last-modified')
if lmd != None:
cur_data = { url: datetime.strptime(lmd, '%a, %d %b %Y %H:%M:%S %Z') }
else:
print "Hmmm, no last-modified data was returned from the URL."
print "Returned header:"
print yaml.dump(dict(r.getheaders()), default_flow_style=False)
나머지 펼쳐지는 페이지를 보관하고 새 버전에 대한 변경 사항을 확인하고 이메일로 누군가에게 경고하는 예가 포함되어 있습니다.
웹 사이트의 마지막 업데이트 날짜와 시간을 확인하는 몇 가지 간단한 단계를 블로그를 작성했습니다. https://sachinapatel.wordpress.com/ 첫 번째 블로그 게시물에서 확인할 수 있습니다.
나를 위해 그것은
article:modified_time
페이지 소스에서.
참고 URL : https://stackoverflow.com/questions/23644436/how-do-i-find-when-a-web-page-was-last-updated
'ProgramingTip' 카테고리의 다른 글
커밋을 병합하거나 추가하지 않고 분기 b에서 a로 변경 사항 적용 (0) | 2020.11.17 |
---|---|
내 ClaimsIdentity IsAuthenticated가 항상 거짓 인 이유는 무엇입니까 (웹 API 승인 필터의 경우)? (0) | 2020.11.17 |
IntelliJ의 '즉시'창 (0) | 2020.11.17 |
도트 그래프 언어-양방향 에지를 만드는 방법? (0) | 2020.11.17 |
SQL을 사용하여 postgres 테이블을 완전히 복사 (0) | 2020.11.17 |