데이터분석
정규식
ADELA_J
2023. 5. 1. 22:15
- 정규표현식, regular expression
: 문자열 패턴을 찾아서 대체하기 위한 규칙의 모음
: regex=True 로 정규표현식을 사용한다고 알리고 해야함.
: 정규 표현식 앞에 쓰는 'r' 은 row string으로써 문자 그대로 읽겠다고 알리는거
1. 숫자 : \d
▷ 4자리면 '\d\d\d\d' 2자리면 \d\d, 중간에 문자열 들어가있으면 안됨.
▷ 중괄호 사용하면 개수 지정 가능 2개면 '\d{2}', 6개면 \d{6}
2. 문자열
▶ . (마침표) : 어떤 문자에도 대응하는 정규 표현식 문자.
▶ * : 개수가 몇 개이든 문자 전체
▶ \ (역슬래시) : 정규 표현식에서 괄호는 그룹을 나타내는데 사용되므로 일반 문자라고 인식하게 하려면 앞에 붙여야함.
▶ \s : 띄어쓰기가 있을때는 공백 문자를 나태는 정규 표현식
▶ \D : 숫자가 아닌 다른 모든 문자에 대응하는 표현