'프로그래밍/Python'에 해당되는 글 2건


한글 코드 범위
ㄱ ~ ㅎ: 0x3131 ~ 0x314e
ㅏ ~ ㅣ: 0x314f ~ 0x3163
가 ~ 힣: 0xac00 ~ 0xd7a3



정규식을 사용하여 한글만 가져오기

# -*- coding: utf-8 -*-
import re

def test():
s='韓子는 싫고, 한글은 nice하다. English 쵝오 -_-ㅋㅑㅋㅑ ./?!'
hangul = re.compile('[^ ㄱ-ㅣ가-힣]+') # 한글과 띄어쓰기를 제외한 모든 글자
# hangul = re.compile('[^ \u3131-\u3163\uac00-\ud7a3]+')  # 위와 동일
result = hangul.sub('', s) # 한글과 띄어쓰기를 제외한 모든 부분을 제거
print (result)

result = hangul.findall(s) # 정규식에 일치되는 부분을 리스트 형태로 저장
print (result)

>> 출력 결과
는 싫고 한글은 하다  쵝오 ㅋㅑㅋㅑ 
['韓子', ',', 'nice', '.', 'English', '-_-', './?!']


[출처] 파이썬 한글 처리|작성자 realization


'프로그래밍 > Python' 카테고리의 다른 글

[Python] 예약어 pass  (0) 2012.02.07
블로그 이미지

JOKERGT

타고난 능력이란, 자연계의 초목과 같아 항상 탐구로써 가지를 쳐줘야 한다. https://www.linkedin.com/in/datajoker1

,