테스트 사이트 - 개발 중인 베타 버전입니다

python get_text() 질문드립니다. 채택완료

망고프리 2년 전 조회 1,927

안녕하세요.

python으로 특정 데이터를 가지고 오는데

contents = soup.find('div', attrs={'id' : 'dic_area'}).get_text()

 

콘텐츠 제작사의 주가 부진이 깊어지는 모습이다.<br><br>20일 증권가에 따르면 이날 콘텐트리중앙은

 

중간에 <br><br> 이 사라지고 

 

콘텐츠 제작사의 주가 부진이 깊어지는 모습이다. 20일 증권가에 따르면 이날 콘텐트리중앙은

 

이렇게 가지고 와서 한줄로 쭉 나옵니다.

내용을 가지고 올때 html 이나 <br><br>까지 다 가지고 올수 있는 방법이 없을까요?

감사합니다.

 

댓글을 작성하려면 로그인이 필요합니다.

답변 1개

채택된 답변
+20 포인트
s
2년 전

</p>

<pre>
<code>from bs4 import BeautifulSoup
html = """
<head>
  <title class="page-title">Hello World!</title>
</head>
<body>
  <div id="content">
    <h1>Title</h1>
    <p>first paragraph</p>
    <p>second paragraph</p>
    <h2>Subtitle</h2>
    <p>first paragraph of subtitle</p>
  </div>
</body>
"""

# 1. build soup object from html text
soup = BeautifulSoup(html, 'lxml')
print(soup.head.title)
# return'<title class="page-title">Hello World!</title>'</code></pre>

<p>

 

'lxml' 대신 'html.parser'를 써도 되지만 lxml이 C언어기반으로 작동하므로 속도가 좀 더 빠릅니다

로그인 후 평가할 수 있습니다

답변에 대한 댓글 1개

망고프리
2년 전
안녕하세요.
너무 잘되네요
감사합니다.

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인