파이썬 기초를 하루만에 끝내고 열심히 과제 지옥에 빠져서 새벽 3시쯤에 잠에 들었습니다. 덕분에 오늘 셀프 테스트는 무난하게 100점 맞을 수 있었어요! 사실 아직 결과는 안 나왔지만 점수 잘 나올 거 같아요.

오늘은 데이터 분석할 때 유용하게 쓰이는 국민 라이브러리 Pandas 에 대해서 배웠습니다. 예전에 머신러닝, 딥러닝 할 때 수도없이 써보고 빅데이터 분석 경진대회 할 때도 계속 썼었는데, 원리에 대해서 그리고 기초적인 부분은 오늘에서야 알았네요.
- 라이브러리 불러오기
import pandas as pd
이렇게 불러오는데, 기능이 엄청나게 많습니다.
이런 기능을 위해서는 어떤 메소드가 필요한 지? 그리고 이름은 기억나는 데 파라미터가 기억 안나면은 일단 무작정 Chatgpt한테 물어보면은 야무지게 알려주거든요.
dataframe의 행 개수를 출력하는 코드가 기억 안날 때?

len(df)
df.shape[0] #0번 인덱스에 있는 값이 행의 개수
혼자서 연습해보다가 까먹으면 이렇게 잘 알려줍니다.
근데, 조금 더 심화된 개념이나 메소드의 파라미터는 이상하게 알려주더라구요
예를들면 완전한 복사는 df.copy() 로는 안된다나.. df.deepcopy() 를 해야한다나..?
그럴때는 Pandas 공식 Documentation을 살펴보면 됩니다.

user guide 내 검색창에 pandas.dataframe.copy 만 쳤는데 바로 메서드 나온거 보세요. 굳...
deep=True 이냐 deep=False 이냐에 따라서 완전 복사가 되냐 안되냐가 결정되나봐요. default 값은 True 이기 때문에 .copy 메소드로도 완전 복사가 가능하다는 점!

아무튼 이 User Guide 덕분에 궁금한 것들도 바로바로 해결하고, 보면 함수 내 파라미터가 엄청나게 많은 경우에 헷갈리거나 이거 default 값이 뭐지..? 하고 생각 안나는 경우 있거든요. 그러면 바로~~ 공식 사이트 들어가서 검색하기. 참 좋은 것 같습니다.
그래서 아무튼 pandas 라이브러리를 활용해서 데이터프레임을 요리조리 만들어도 보고, 삭제도 해보고, 값을 추가해보기도 하고 여러 방면으로 가지고 놀았습니다. 조회도 해보고 merge, join 등등 파일 출력까지도요.
열 변경하는 df.rename() 메서드는 변경해주는 column name 을 dictionary 형태로 { key(기존 column명) : value(바꿔줄 column명)} 이런식으로 제공해주더라구요? 지금까지 배웠던 튜플, 리스트, 딕셔너리 등등의 자료형이 데이터분석에서 죽을 때 까지 쓰이는 거 보고 놀랐습니다. 마치 수학을 배우는 기분
원래는 오늘 배웠던 거 항목별로 정리해서 보기좋게 노트처럼 쓰려고 했는데, 저작권이 어디까지 걸리는 지를 잘 모르겠어서 일단 느낀점 위주로 작성하고 있긴 합니다. 제가 좀 더 노련해져서 코드를 뚝딱뚝딱 만들고, 분석할만한 데이터 찾아서 하고싶은 게 생긴다면! 그날 배웠던 내용들을 해당 데이터를 가지고 이리저리 전처리도 해보고 시각화도 해보고 하는 프로젝트 느낌으로 작성하겠습니다.
아직 데이터분석이 며칠 더 남아서 그때까지 더 파이팅하겠습니다.. 아자아자 주말이라 행복해요 9 to 6 는 마치 고등학생이 된 기분입니다. 비대면이어도 한 자리에 오래 앉아있는 게 장난아니네요 ㅋㅋㅋ쿠
'Bootcamp > KT aivle school' 카테고리의 다른 글
04.02 kt 에이블 스쿨 6일차 이변량 분석 (0) | 2025.04.03 |
---|---|
04.01 kt 에이블스쿨 5일차 pandas, seaborn 응용 | Java 코딩테스트 입문 (0) | 2025.04.01 |
03/31 kt 에이블스쿨 4일차 데이터 시각화 (0) | 2025.04.01 |
03/27 KT 에이블 스쿨 2일차 교육 후기 (0) | 2025.03.28 |
03/26 KT aivle school 1일차 교육 후기 (0) | 2025.03.27 |