본문 바로가기
Python/PythonLibrary

정규표현식 (regular expression) (import re)

by leehii 2022. 7. 13.

 import re 

 result = re.compile('[조건]+').findall(처리할변수) 

 

 list일경우 

 text = '기준'.join(list명) 

 으로 텍스트화 한후 

 정규표현식을 사용하기 

 

 (ex) 

 a_list=['hi', 'hello', 1, 2, 3] 

 text=','.join(a_list) 

 result = re.compile('[\d]+').findall(a_list) 

 

-------------------------------------------------

 

지정 요약 찾는 값 찾는 값 (상세)
[0-9] [\d] 숫자찾기 숫자찾기
[^0-9] [\D] 숫자빼고 찾기 텍스트 + 특수문자 + 화이트스페이스
[ \t\n\r\f\v] [\s] whitespace(공백문자)  찾기 스페이스, TAB, 개행(new line)
[^ \t\n\r\f\v] [\S] 공백문자 빼고 찾기 텍스트 + 특수문자 + 숫자
[a-zA-Z]   모든 영어 찾기 모든 영어 찾기
[a-zA-Z0-9] [\w] 문자+숫자 찾기 문자+ 숫자
[^a-zA-Z0-9] [\W] 문자+숫자빼고 찾기 특수문자 + 공백
[ㄱ-ㅎ]   한글 자음만 찾기 한글 자음만 찾기
[ㄱ-ㅎ|ㅏ-ㅣ]   한글 자음, 모음 찾기 한글 자음, 모음 찾기
[가-힣]   한글만 찾기 한글만 찾기

 

  - 가 범위를 나타내고 ^는 반대를 not을 의미함

 

 . (DOT)는 사이의 모든 문자를 의미함

   (ex)

   [a.b]    :  a와 b  사이의 모든 문자

 

 반복  * 과 +

    *은 0번이상 반복, +는 1번이상 반복을 의미함

 

 | 을쓰면 or 조건을 넣을수 있고

 

 ( )으로 그루핑을 통해 묶을 수있다

 

 

 

 match 문자열의 처음부터 정규식과 매치되는지 조사 

 search 문자열 전체를 검색하여 정규식과 매치되는지 조사

 findall 정규식과 매치되는 모든 문자열(substring)을 리스트로 리턴 

 split 패턴으로 문자열을 Str 형태로 리턴