테스트 사이트 - 개발 중인 베타 버전입니다

PHP로 만든 RSS 2.0 리더 소스

PHP로 만든 RSS 2.0 리더 소스

소스는 PHP5로 작성했고, 내장된 SAX 파서를 이용했습니다.
SAX파서는 이벤트 기반 파서라서 구현도 간단하고, 속도도 빠릅니다.

RSS는 현재 가장 널리 쓰이는 RSS 2.0을 대상으로 했습니다.
이글루스와 테터도 RSS 2.0을 지원하고 있습니다.


rss_fetch.php
<?php

 include_once 'lib.php';

  //가져올 RSS 주소를 지정하면됩니다. 
$urls = array('http://sizuha.egloos.com/index.xml', 'http://kori2sal.innori.com/rss');

 foreach ($urls as $url):
     $handle = fopen($url, 'r');

     if ($handle):
          $document = '';

          while (!feof($handle))
               $document .= fgets($handle, 4096); 

          fclose($handle);

           //파서 생성
           $rss = new RSSParser;

           //파싱
          $rss->setRSS($document);
          rssParse($rss);

          $rss = NULL;
     endif;
endforeach;

?> 


lib.php
<?php

 function rssParse($rss_obj)
 {  
      //내장 XML 파서 생성
     $xml_parser = xml_parser_create('UTF-8');
  
     xml_set_object($xml_parser, $rss_obj);   
     xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, FALSE);

      //XML 파서에 이벤트 핸들러를 할당
     xml_set_element_handler($xml_parser, "startElement", "endElement");
     xml_set_character_data_handler($xml_parser, "characterData");

      //XML 파싱
     xml_parse($xml_parser, $rss_obj->getRSS());
     xml_parser_free($xml_parser);
 }


 class RSSParser
{
     private $rss_doc;
 
     private $current_element;
     private $in_item = FALSE;
     private $in_description = FALSE;
     private $title;
     private $date;
     private $link;
     private $category;
     private $content;

 
     function setRSS($rss_text)
     {
          $this->rss_doc = $rss_text;
     }
 
     function getRSS()
     {
          return $this->rss_doc;
     }

     //태그가 시작하는 부분에서 처리할 내용  
     function startElement($parser, $element, $attrs)
     {
          if ($this->in_description) return;    

          $this->current_element = strtoupper($element);
  
          switch ($this->current_element):
               case 'ITEM' :
                    $this->in_item = TRUE;
                    break;

               case 'DESCRIPTION' :
                    if ($this->in_item) {
                         $this->in_description = TRUE;
                         $this->content = '';
                    }
                    break;
    
               default: 
                    break;     
          endswitch;
     }
 
     function endElement($parser, $element)
     {
          $el = strtoupper($element);

          if ($this->in_description and 'DESCRIPTION' != $el) return;

          switch (strtoupper($el)):
               case 'ITEM' :
                    $this->in_item = FALSE;
                    $this->printItem();        // 저장된 포스트를 출력하거나 DB로 자장하면 됨.
                     break;

               case 'DESCRIPTION' :
                    if ($this->in_item) {
                         $this->in_description = FALSE;
                    } 
                    break;

               default: 
                    break;     
          endswitch;

          $this->current_element = '';
     }
 
     function characterData($parser, $data)
     {   
          if ('' == trim($data)) return; 
 
          if ($this->in_item):
   
           switch ($this->current_element):
                case 'TITLE' :
                     $this->title = $data;
                     break;

                case 'DESCRIPTION' :
                     $this->content .= $data; //반드시 .= 연산자를 써야함!
                      break;

                case 'CATEGORY' :
                     $this->category = $data;     
                     break;

                case 'PUBDATE' :
                     $this->date = $data;
                     break;

                case 'LINK' :
                     $this->link = $data;
                     break;
           endswitch;   
    
          endif;
     }      

      //여기서는 바로 출력을 하지만, DB에 저장하는 방식으로 구현할 수도 있습니다.
      private function printItem()
     {
          echo "<P><STRONG>";
          echo $this->title;
          echo "</STRONG>";
   
          echo "  (";
          echo $this->date.")</P>";
   
          echo $this->content;
          echo "<BR>";
          echo $this->category." | ";
          echo $this->link;
  
          echo "<br><br>";
     }
   
 }//end of class

?>


RSS 리더를 만들 때의 주의사항

1. RSS는 UTF-8로 인코딩되어 있습니다. 따라서 RSS의 데이터를 변환없이 그냥 웹페이지에 뿌리려면, 웹페이지 역시 UTF-8로 인코딩되어 있어야 합니다. 저는 모든 작업 파일들(PHP, HTML, TXT)을 전부 UTF-8로 통일했습니다.

2. RSS의 PubDate 태그는 게시물의 날짜를 담고 있는 태그이지만, 문제는 이것이 GMT 시간입니다. 웹에 게시할때는 현지(한국) 시간으로 변환해야 할 것입니다.
[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 4개

감사합니다^^

추천하고 바로 테스트 해보러 갑니다
일전에 유창화 님의 파서관련 강의를 보고 캐감동 했었는데^^~
이렇게 지식을 나누어 주시는 분들이 있어 세상이 아직 따뜻한가 봅니다~
감사합니다 ^^
공부하는데 많은 도움이 되었습니다!
다음 카페/네이버 카페에 게시글들이 많은 카페가 있는데,
독립 홈페이지로 게시글들을 이전하는데에, RSS 기능을 활용할 수 없을런지
막연히 생각 중입니다.
너무너무 감사합니다.!

게시글 목록

번호 제목
29519
13798
21031
430
426
13796
422
418
13793
415
29513
13791
407
392
383
381
371
368
13785
364
361
21027
29509
29507
357
13779
356
29505
13778
13775
29504
13774
353
350
346
13773
29494
25166
13771
13769
340
329
13765
324
319
318
314
312
310
307
300
299
13761
13758
13756
13754
13752
13750
29493
29492
13749
13747
29489
13746
13745
13744
13743
13742
29488
13740
13739
13738
13737
13731
13730
13729
13728
13727
29487
13726
13725
13724
13723
29486
13722
13721
13720
29485
13719
JavaScript case 문
21013
21007
13715
13713
13710
13707
13705
13700
25155
13698
13697