키워드 필터링
키워드를 분리해내며 검사해내는 과정 입니다. ㅎㅎㅎㅎㅎㅎㅎ
왼쪽은 분리해내는 과정.
가운데의 A는 분리한 키워드, B는 필터된 키워드
오른쪽은 가운데와 마찬가지로 다른 키워드로 검사한 것

왼쪽은 분리해내는 과정.
가운데의 A는 분리한 키워드, B는 필터된 키워드
오른쪽은 가운데와 마찬가지로 다른 키워드로 검사한 것

댓글 4개
15년 전
저만 어렵나요? 짱돌 굴려봐도 모르겠습니다!
15년 전
키워드를 분리해내는 쪽을 잘 모르겠어요. 전 그냥 DAUM API 사용하는 것으로 ㅎㅎ;
15년 전
앞에서부터 분리하고, 뒤에서부터 분리하고
두글짜부터 분리하고, 세글짜부터 분리하고, 네글짜부터 분리하고
두글자씩 첫번째부터 분리하고, 두글자씩 두번째부터 분리하고, 두글자씩 세번째부터 분리하고
세글자씩 첫번째부터 분리하고, 세글자씩 두번째부터 분리하고...
총 바이트를 구해서 계속 분리하면서 필터에 있는 단어와 검사를 하는거죠!
두글짜부터 분리하고, 세글짜부터 분리하고, 네글짜부터 분리하고
두글자씩 첫번째부터 분리하고, 두글자씩 두번째부터 분리하고, 두글자씩 세번째부터 분리하고
세글자씩 첫번째부터 분리하고, 세글자씩 두번째부터 분리하고...
총 바이트를 구해서 계속 분리하면서 필터에 있는 단어와 검사를 하는거죠!
15년 전
이런건 형태소 분석기로 하는게 정신건강에 좋습니다.
"대학생선교회"
잘못 추출하면, 대학 + 생선 + 교회 가 나옵니다.
http://nlp.kookmin.ac.kr/HAM/kor/ham-intr.html 전 주로 이분껄 사용합니다만, 상업용으로 공개하신게 아니라서..
http://cs.sungshin.ac.kr/~shim/demo/mach.html 이건 공개용 버전인듯
"대학생선교회"
잘못 추출하면, 대학 + 생선 + 교회 가 나옵니다.
http://nlp.kookmin.ac.kr/HAM/kor/ham-intr.html 전 주로 이분껄 사용합니다만, 상업용으로 공개하신게 아니라서..
http://cs.sungshin.ac.kr/~shim/demo/mach.html 이건 공개용 버전인듯
게시판 목록
토크
개발과 관련된 어떤 얘기도 괜찮습니다.
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 3601 |
느긋한카키쿠키
|
5일 전 | 4 | |
| 3600 |
nature1235
|
11개월 전 | 437 | |
| 3599 |
swallow
|
2년 전 | 1348 | |
| 3598 |
swallow
|
2년 전 | 1195 | |
| 3597 |
swallow
|
2년 전 | 799 | |
| 3596 | 2년 전 | 1418 | ||
| 3595 | 2년 전 | 695 | ||
| 3594 | 2년 전 | 1413 | ||
| 3593 |
|
3년 전 | 1238 | |
| 3592 |
|
3년 전 | 1572 | |
| 3591 |
|
3년 전 | 1486 | |
| 3590 |
|
4년 전 | 1446 | |
| 3589 |
|
4년 전 | 1246 | |
| 3588 |
|
4년 전 | 1225 | |
| 3587 |
|
4년 전 | 1139 | |
| 3586 |
|
4년 전 | 1373 | |
| 3585 |
|
4년 전 | 1294 | |
| 3584 |
|
4년 전 | 1039 | |
| 3583 |
Arm코리아
|
4년 전 | 1135 | |
| 3582 |
|
4년 전 | 1243 | |
| 3581 |
|
4년 전 | 2199 | |
| 3580 |
|
4년 전 | 1272 | |
| 3579 |
|
4년 전 | 1300 | |
| 3578 |
|
4년 전 | 1534 | |
| 3577 | 4년 전 | 1672 | ||
| 3576 |
|
4년 전 | 1665 | |
| 3575 |
|
4년 전 | 1675 | |
| 3574 |
|
4년 전 | 2095 | |
| 3573 |
|
4년 전 | 1549 | |
| 3572 |
|
4년 전 | 1536 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기