본문 바로가기

Python39

Algorithm - 개요2 - 문제를 해결하기 위한 절차나 방법 - 컴퓨터가 어떤 일을 수행하기 위한 단계적 방법 1. 슈도코드 - 일반적인 언어로 코드를 흉내 내서 알고리즘을 써 놓은 코드. - 특정 언어로 프로그램을 작성하기 전에 알고리즘을 대략적으로 모델링하는데 쓰임 2. 순서도(Flow chart) - 진행 흐름을 순서에 따라 기호나 문자로 나타낸 도표 - 흐름도. 데이터 처리 과정을 표현하는데 사용 - 프로그램을 작성하기 전 전체적인 흐름과 과정 파악을 위해 필수적으로 거쳐야 되는 작업 1. 정확성 : 얼마나 정확하게 동작하는가? 정확성이 높을 수록 좋음 2. 작업량 : 얼마나 적은 연산으로 원하는 결과를 얻어내는가? 적을수록 좋음. 3. 메모리 사용량: 얼마나 적은 메모리를 사용하는가? 적을수록 좋은 알고리즘. 4. 단.. 2023. 12. 14.
Algorithm - 개요1 08~ 10행은 순차적으로 실행. 08~ 10 처럼 한 문장씩 순서대로 처리되는 구조가 순차 구조 sequential structure 09~10은 if문으로 복합문임. if와 콜론 사이에 있는 조건식이 있고, 조건식 true/false에 따라 실행 흐름이 변경되는 구조를 선택 구조 select structure 라고 함. 알고리즘 흐름은 위에서 아래 긴 네모 안에 작성한 작업이 실행되고 (← 이거 표시는 대입임) 마름모 모양 안에 작성한 조건식에 따라 True /False 중 하나 따라가고 ▶ 조건식에 따라 흐름이 두 갈래로 나뉘는 것을 양갈래 선택 이라고 부름 알고리즘이 흐르는 방향은 조건식이 결정. 형 변환 type conversion 코드 01에서 처럼 input은 문자열을 입력받아 반환함. (그.. 2023. 12. 5.
Python 텍스트 전처리 특수문자 제거하는 방법 학습을 위해 데이터를 가져오다보면 종종(아니 엄청 자주) 텍스트 사이에 특수문자가 있는 경우가 있다. 말뭉치나 문장으로 할 때 좀 더 좋은 성능을 위해 깔끔하게 문장을 다듬는 경우들이 있는데 이럴 때 쓰이고는 한다. (그 외에도 토큰화를 위한다던지 등등 많은 경우들이 있지만) 방법은 크게 2가지가 있는데, 1. replace를 사용하기 replace 메서드를 사용해서 첫번째 파라미터에 바꿨으면 하는거, 두번째는 바꿀거 를 작성하면 된다. 그렇다면 따란 하고 바뀐다. 2. 정규표현식을 사용한 re.sub 파이썬에서 정규표현식을 사용할 때는 import re 를 사용한다. 그 중에서 sub는 정규식을 지정한 문자열을 바꿔주는 메서드이다. 정규식 관련 ▶ https://dev-adela.tistory.com/.. 2023. 11. 3.
시계열 데이터로 다양한 사례 다뤄보기 ebola 데이터를 보면 행과 열을 5개씩 불러보면 시간이 역순으로 정렬되어 있음. ▶ 에볼라가 발생하기 시작한 날을 알기 위해 min 메서드를 사용하여 찾을 수 있음 ▶ Date열에서 최초 발병일을 빼서 진행 정도를 새로운 열로 추가 할 수 있다. ▼ 이 데이터로 해볼거임. ▶ 보면 Closing Date와 Updated Date가 시계열 데이터로 보이지만 확인해보면 object, 문자열이다....속지말자 ㅎ ▶ 그래서 read_csv 메서드의 parse_dates 속성을 이용해 datetime 으로 변환해준다. https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html#pandas.read_csv ▶ dt접근자와 quarter속성을 사용해서 .. 2023. 7. 18.