전체 글 18

딥러닝을 배웠어요

오늘은 Yolo 파인튜닝,NLP 자연어 처리에 대해서 배웠다. 근데 코딩테스트 문제 갑자기 입문 -> 초급 풀어야 해서자료구조 모르겠는게 태산이고 알고리즘도 모르겠는데문제난이도는 갑자기 훅 올라가서 막막하고 답답하다 코테 스터디 하는데 중급 난이도의 문제도 출제해야 한다고 한다지금 매주 20문제 푸는것만으로도 벅찬데 이번주는 벌금 내야할 거 같다정보처리기사 공부도 계획한 것 만큼 순조롭게 잘 안흘러 간다 왜 하면 할수록 해야할 것들이 점점 늘어나는 건지 잘 모르겠다내 머리가 좀 더 똑똑했으면 한다. 코딩테스트 문제를 풀었고, 리뷰를 썼다각 자리수를 구하는 문제를 풀었다while( temp > 0) { int c = temp % 10; countlist[c]++; temp /= 10;}a..

python & 딥러닝

python super 클래스super().부모클래스의 메서드super().__init__() : 부모의 메서드를 사용할 수 있게 임시로 지정해주는 것.부모의 __init__() 를 자식에서 불러와서 실행함. 딥러닝이미지처리 yolo 모델을 배웠습니다비디오 처리도 해주고요 그리고 클래스로 모델을 정의하는 방법,레이어 여러개 추가하고 하이퍼파라미터 조정하는 법을 배웠습니다너무 잠와서 이만 줄일게요..

CNN과 Hidden Layer with pytorch

딥러닝-데이터 전처리가 필요하다.Null값 조치, 더미변수화, 정규화, 데이터 분할텐서로 변환, Data Loader(train set) 으로 변환-모델링에서는 손실함수, Optimizer, 모델 설계, learning rate에 대한 검토가 필요함 Data Loader : Batch size 만큼 쪼개서 데이터를 제공한다Feed Forward : 예측하고, 오차를 계산 / Back propagation : 가중치를 조정 과적합을 막는 수단들-Epoch, learning rate-hidden later, node 숫자들-Early Stopping : val error이 이전 최소 val error 보다 계속 높아지는게 일정 횟수 반복되면 학습 종료-Dropout : hidden layer의 노드 중 일정..

BigInteger, array 정렬

BigInteger-Java에서 매우 큰 정수를 다루기 위해 제공되는 클래스-java.math 패키지에서 BigInteger 클래스를 제공-이론적으로 메모리가 허용하는 한 무한대의 정수 다룰 수 있음 ​BigInteger의 특징-불변성(Immutable): BigInteger 객체는 한 번 생성되면 그 값을 변경할 수 없음, 연산 결과는 새로운 BigInteger 객체로 반환-다양한 연산 지원: 사칙연산뿐만 아니라 모듈러 연산, 비트 연산 등 다양한 연산을 지원 1. 선언 및 초기화import java.math.BigInteger;BigInteger bigNumber = new BigInteger("12345678901234567890");// long 값 기반 생성, valueOf 메서드 사용BigIn..

4.7 딥러닝 모델링

파라미터 초깃값은 랜덤할당학습할 때 그래서 랜덤하게 결과가 다르게 나타날 수 있음 스케일링을 반드시 해주자~ MinMaxScaler or Standardization 회귀 모델링nn.Linear(input, output)손실함수는 nn.MSELoss() / Mean Squared Error 로 측정!가중치 없데이트하는 optimizer도 설정 batch_size를 통해서, 학습 단위를 설정 : DataLoader 파라미터에서 설정해준다Epochs : 학습을 얼마나 반복할 것인지 설정 은닉층 HiddenLayer 은, 활성함수를 필요로 한다. 대부분 ReLU 함수 사용=> max(0, x) 라서 음수인 경우에 다 0으로 변환해줌. 비선형 함수라서, 딥러닝 즉, 레이어를 여러겹 쌓는 것이 가능해진다.sigm..

4.3 kt 에이블 스쿨 7일차 - 머신러닝, 코딩테스트 풀이

이제 데이터 불러오기, 탐색적 데이터 분석, 전처리, 시각화 및 분석을 끝마치고 머신러닝을 배웠습니다.사실 이거 하루만에 배우기에는 힘든 내용이라 주요 모델에는 어떤게 있나 정도만 살펴보고, 상세 파라미터나 모델 개선 등등은 직접 알아가면서 해봐야 할 것 같습니다. 이전에 들었던 내용들이었기에 망정이지, 아니었으면 따라가기 좀 벅찰 것 같네요 ㅋㅋㅋ 필수 라이브러리 모음import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport sklearn 데이터 분석df.head() df.tail()df.info()df.describe() # 기술통계df.corr(numeric_only=True) # 상관계..

04.02 kt 에이블 스쿨 6일차 이변량 분석

이변량 분석에는 총 네가지가 있다서로 다른 타입의 변수를 비교하는 것 수치형 -> 수치형시각화 : 산점도# pyplot을 이용plt.scatter(x='', y='', data=, s=20, c='b') # s는 점의 크기, c 는 컬러# seaborn을 이용sns.scatterplot(x='', y='', data=, s=15, edgecolor=T/F) # edgecolor는 점 테두리선# 추가적인 시각화sns.pairplot() # dataframe 내 전체 변수에 대한 비교sns.jointplot(x='', y='', data=, kind=, marginal_kws={ : })# marginal_kws : dictionary 형태로 파라미터 값을 지정해줄 수 있음 ex. {'bins' : 15}#..

04.01 kt 에이블스쿨 5일차 pandas, seaborn 응용 | Java 코딩테스트 입문

데이터 시각화 그래프 많은 종류들을 응용하고 실습하는 날1. 단변량분석 - 수치형df['column'] 으로 조회를 하게 되면, 결과값이 Series로 나오게 된다. 여기다가 [] 를 붙여서 리스트로 만들어주게 되면, df[['column']] 으로 되면서 결과값이 Dataframe으로 변환이 된다!df[['column']].describe().T 를 하면 기술통계량을 아주 편하게 살펴볼 수 있다는 꿀팁~시각화-Histogramplt.hist(x='column', data=dataframe, edgecolor='color', alpha=number)sns.histplot(x='column', data=dataframe, bins=number)plt.show()-Density Plot : Histogram..

03/31 kt 에이블스쿨 4일차 데이터 시각화

오늘은 Python 데이터 분석시에 사용하는 국민 라이브러리1. matplotlib2. seaborn이 두가지에 대해서 배웠습니다. 사실 사전교육에서도 어느정도 맛을 봤고, ChatGPT 한테 시각화해달라고 Python 코드 짜달라고 하면 주구장창 출력해주는게 요 두 라이브러리 였기 때문에 어느정도 익숙하긴 했거든요.그치만, 무작정 시켜서 출력된 코드 냅다 같다 붙이던 때랑 하나하나 파라미터와 메서드가 어떤 의미를 가지는 지 분석하는 것. 그리고 직접 타이핑하면서 의미를 다시금 생각해보는 건 좀 다르더라구요. -matplotlib : 사용자가 원하는 대로 세밀하게 조정 및 커스텀이 가능. 그렇지만, 그만큼 타이핑해야 할 코드의 양이 많고 여러 그래프 및 여러 옵션을 추가하게되면 상당히 비효율적일 수 있음..