테스트 사이트 - 개발 중인 베타 버전입니다

다른홈페이지 메인 이미지와 제목 가져오기 채택완료

열린이글1 6년 전 조회 4,070

                                          

 

다름 홈페이지 메인의 웹페이지 소스보기하니까 위처럼 나오는데요

제홈페이지 DB 에      의 eagle 부분과

 

218160428_480x270.jpg?655 을 가져와서 저장 하는 소스는 

크롤링 이라고하던데요 

예제 소스나 참고할수있는 사이트좀 알려주세요

댓글을 작성하려면 로그인이 필요합니다.

답변 4개

채택된 답변
+20 포인트
6년 전

크롤링은 curl이나 simple_dom 아니면 웹페이지 크롤링으로 검색해보세요 

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

그누위즈

php에서 제공하는 여러 함수나 오픈소스로 된 class 를 찾아보시면

크롤링 및 파싱에 관련한 여러 소스들이 나오실겁니다.

결국 원하는 부분만 가져오게하려면

정규식으로 원하는 div나 meta태그를 걸러내셔야합니다.

위의 질문은 메타태그를 가져오고 싶어하시니

특정 페이지를 크롤링 하시어 한줄마다 읽어들이면서 메타태그를 열때와

닫을때를 정규식으로 구분하시어 배열에 담습니다.

그 이후 해당 배열을 순환하며 원하는 메타태그를 찾을시

특정 content 부분을 또 가져와서 특정 변수에 넣어 사용하셔야 합니다.

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

크롤링 관련 정규식 예제 입니다.

https://reksai.tistory.com/7">https://reksai.tistory.com/7

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

크롤링 이란 단어를 먼저 이해하셔야할듯하네요

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인