본문 바로가기

자격증4

[빅분기] 독학 합격 후기 0. 빅분기 8회 응시빅데이터분석기사는 난이도가 정보처리기사보다 압도적으로 낮으나, 기업 채용 시 인정해주는 자격 점수는 똑같아서 취득을 결심하게 되었다. 빅분기는 오래된 자격시험이 아니다 보니, 합격수기나 후기가 적었다. 문제 자체도 체계화되지 않은 기분이 들었다. 빅분기 응시자격이 있어서 졸업하고 이제야 취득하게 되었다. (응시자격 = 대학 졸업자 / 졸업증명서, 학위증, 학위취득증명서 중 1부 제출해야함) https://www.dataq.or.kr/www/sub/a_07.do데이터자격시험대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업www.dataq.or.kr 1... 2024. 6. 24.
[빅분기 실기] 3유형 # 데이터마님# 7회 기출 변형 # 상관계수 df.corr()['Target'].sort_values()[-2] # 개수세기 value_count() size() # 다중선형회귀모델링 sm.OLS(y,X).fit() import statsmodels.api as sm X = df.drop('종속변수명', axis=1) # 1. 종속변수 제외한 모든 변수로 하는 경우 X = sm.add_constats(X) # 상수항 추가 X = sm.add_constant(df[['age', 'Cholesterol']]) # 2. 특정 변수만 가지고 하는 경우 y = df['종속변수명'] model = sm.OLS(y,X).fit() print(model.summary()) # 모델결과 확인 params = model... 2024. 6. 14.
[빅분기 실기] 2유형 # 데이터마님# 7,6,5회 기출 변형회귀 - 7,5 분류 - 6,4,3 # 데이터 로드 import pandas as pd df = pd.read_csv('') # sklearn 불러오기 from sklearn.model_selection import train_test_split # 데이터 분할 from sklearn.ensemble import RandomForestRegressor # 회귀모델 from sklearn.ensemble import RandomForestClassifier # 분류모델 from sklearn.preprocessing import LabelEncoder # 전처리 - 라벨인코딩 from sklearn.metrics import mean_squared_error, f1_s.. 2024. 6. 14.
[빅분기 실기] 1유형 # 데이터마님# 7회 기출 변형https://www.datamanim.com/dataset/practice/ex7.html 개수 세기 len(df) 개수(널값 제외) count() 행개수 shape[0] 열개수 shape[1] 결측치 dropna() fillna() fillna(method = 'ffill') # 직전의 행 값으로 채우기 bfill # 다음행, 위 값으로 채우기 isnull() notnull() 정렬 sort_values().index[-2] 인덱스 인덱스 최대값 idxmax() 인덱스 리셋 reset_index(drop=True) # drop안하면 기존인덱스가 칼럼으로 저장됨 sort_values().reset_index().iloc[2].values sort_value('칼럼명') v.. 2024. 6. 14.