<정규식으로 전화번호 패턴 찾기>
1. 테스트 데이터를 준비한다.
2. match 메서드를 사용해 pattern 인자에 10개의 숫자를 의미하는 \d 10개를 넣고
string에는 문자열을 전달해서 패턴을 찾으면 match 오브젝트를 반환할 수 있게 해줌
찾고나니 span에는 패턴의 인덱스와 찾은 패턴의 문자열을 보여주고 있음.
3. bool 메서드에 m을 전달하니 match가 되어서 True라는 결과값을 반환 받을 수 있음.
4. (29-30) 첫번째와 마지막 인덱스 반환
(31) span은 찾은 패턴의 첫번째와 마지막 인덱스 한꺼번에 반환
(32) group 은 찾아낸 패턴을 반환
5. 하지만 전화번호 적으라면 깔끔하게 123457789 이렇게 잘 쓰는 사람들만 있는 것이 아니지.
010 1235 15412 이렇게 쓰는 사람도 있을것이고 010-2535-1238 이렇게 쓰는 사람들도 있을것이고.
그렇게 되면 못찾는다 ㅠ
* \d\d\d\d\d\d\d\d\d\d\d = \d{10}
6. 그래서 빈칸을 의미하는\s? 정규식을 넣어서 다시 작성해서 찾아주니 찾을 수 있었다.
7. 지역코드 같이 소괄호로 감싼 것들은 이런 정규식을 쓸 수 있다.
8. 국가 코드까지 있으면 이렇게......................
*** 패턴을 반복해서 사용하려면 compile 메서드로 저장한다음에 사용하면 됨.
<compile>읽어보기
'데이터분석' 카테고리의 다른 글
데이터 클렌징 NaN 처리/mapping / cut / 연습문제 (0) | 2023.07.11 |
---|---|
넘파이 ndarray, 리스트, 딕셔너리 ↔ DataFrame (0) | 2023.07.04 |
정규식표현 문법, 특수 문자, 메서드 정리 (0) | 2023.07.04 |
pandas와 matplotlib 을 이용하여 산점도 그리기 연습 문제 (0) | 2023.07.04 |
정규식 (0) | 2023.05.01 |