python get_text() 질문드립니다. 채택완료
망고프리
2년 전
조회 1,927
안녕하세요.
python으로 특정 데이터를 가지고 오는데
contents = soup.find('div', attrs={'id' : 'dic_area'}).get_text()
콘텐츠 제작사의 주가 부진이 깊어지는 모습이다.<br><br>20일 증권가에 따르면 이날 콘텐트리중앙은
중간에 <br><br> 이 사라지고
콘텐츠 제작사의 주가 부진이 깊어지는 모습이다. 20일 증권가에 따르면 이날 콘텐트리중앙은
이렇게 가지고 와서 한줄로 쭉 나옵니다.
내용을 가지고 올때 html 이나 <br><br>까지 다 가지고 올수 있는 방법이 없을까요?
감사합니다.
댓글을 작성하려면 로그인이 필요합니다.
답변 1개
채택된 답변
+20 포인트
2년 전
</p>
<pre>
<code>from bs4 import BeautifulSoup
html = """
<head>
<title class="page-title">Hello World!</title>
</head>
<body>
<div id="content">
<h1>Title</h1>
<p>first paragraph</p>
<p>second paragraph</p>
<h2>Subtitle</h2>
<p>first paragraph of subtitle</p>
</div>
</body>
"""
# 1. build soup object from html text
soup = BeautifulSoup(html, 'lxml')
print(soup.head.title)
# return'<title class="page-title">Hello World!</title>'</code></pre>
<p>
'lxml' 대신 'html.parser'를 써도 되지만 lxml이 C언어기반으로 작동하므로 속도가 좀 더 빠릅니다
로그인 후 평가할 수 있습니다
답변에 대한 댓글 1개
�
망고프리
2년 전
댓글을 작성하려면 로그인이 필요합니다.
답변을 작성하려면 로그인이 필요합니다.
로그인
너무 잘되네요
감사합니다.