데이터분석

정규식

ADELA_J 2023. 5. 1. 22:15

- 정규표현식, regular expression 

  : 문자열 패턴을 찾아서 대체하기 위한 규칙의 모음

  : regex=True 로 정규표현식을 사용한다고 알리고 해야함.

  : 정규 표현식 앞에 쓰는 'r' 은 row string으로써 문자 그대로 읽겠다고 알리는거

 

  1. 숫자 : \d 

     ▷ 4자리면 '\d\d\d\d'  2자리면 \d\d,  중간에 문자열 들어가있으면 안됨.

     ▷ 중괄호 사용하면 개수 지정 가능 2개면 '\d{2}', 6개면 \d{6}

 

 2. 문자열

  ▶ . (마침표) : 어떤 문자에도 대응하는 정규 표현식 문자. 

  ▶ * : 개수가 몇 개이든 문자 전체

  ▶ \ (역슬래시) : 정규 표현식에서 괄호는 그룹을 나타내는데 사용되므로 일반 문자라고 인식하게 하려면 앞에 붙여야함.

  ▶ \s : 띄어쓰기가 있을때는 공백 문자를 나태는 정규 표현식

  ▶ \D : 숫자가 아닌 다른 모든 문자에 대응하는 표현