Skip to content
8회 기출문제
제1유형
1) 각 국가에서 맥주 소비량이 많은 대륙을 고르고 (EU), 그 대륙에서 소비량 순으로 5번째에 위치하는 나라(Ireland)의 소비량? 정답: 313
2) 먼저 관광객/전체 방문객으로 관광객 비율 구하기 -> 관광객비율로 내림차순 정렬하고 두 번째 국가의 공무 목적에 따른 방문 인원 + 관광으로 내림차순 하여 두 번째 나라의 사업 목적에 따른 인원 (일본과 홍콩이었음) 정답: 239
3) 데이터에서 co와 nmhc 칼럼 데이터를 Min-Max scaling 이후 표준편차 빼기 정답: -0.026
제2유형
2) 회귀 문제 – 지하철 이용객수 예측 – 평가지표: MAE
- 변수 10개 이상 – 연속형, 범주형 모두 존재 – 결측값 없음
- Linear regression은 MAE 400점, random forest는 140~150점 정도
- 일부 수험생들 100~ 150 점 사이, 혹은 완전 400 점대 -> 아마 90~110이 만점일 듯
- 답안을 반올림해야 하나 안 해야 하나 논란이 있긴 한데, 시험 예시 답안은 정수긴 했음
- 범주형 변수들 조합 후 파생변수 생성 -> XGB 회귀모형에 기본 파라미터로 예측 시 검증 데이터에서 성능 우수
- 파라미터 튜닝 안 하는게 나음
- 결과값을 정수로 제출해야할 것 같은데 설명이 분명하지 않음 / 반올림 후 제출
제3유형
1) 고객 이탈율 예측
1-1) 로지스틱 회귀 모델을 만들고, 중 유의한 변수의 수 구하기 답 : 12
1-2) 유의한 변수의 상관계수 평균, 여기에 상수항을 포함하는지 아닌지 관해서 공지가 올라왔는데, 대부분 헷갈려했고 틀렸을 듯. 만약 상수항 포함이면? 답 : -0.456
- 유의한 변수만 사용 시 회귀계수들의 합계 또는 평균..(이 결과에서 유의한 변수만 쓰라고 했는지 아닌지는 잘 기억나지 않네요)
1-3) 예시 데이터로 위 회귀모델에 따른 y값 구하기 -> 기억 안 남
- 특정 변수가 5 단위 증가할 때 오즈비가 어떻게 되는지
2) 지능 예측
- 세 개 변수를 이용해 지능을 예측하는 다중선형회귀를 적합
2-1) 여러 변수가 IQ에 미치는 영향 LinearRegression로 계산, brain 크기 변수에 따른 회귀계수 값 답 : 2.129
2-2) 결정계수값 답 : 0.313
2-3) 특정 변수가 5배일 때, 오즈비 값? exp(coef(model)*5)이며, 104.873로 적었는데, 대부분 답이 동일
7회 기출문제
제1유형
제2유형
제3유형
6회 기출문제
제1유형
제2유형
제3유형
5회 기출문제
제1유형
제2유형
제3유형
4회 기출문제
제1유형
제2유형
제3유형
3회 기출문제
제1유형
제2유형
제3유형
2회 기출문제
제1유형
제2유형
제3유형
1회 기출문제
제1유형
제2유형
제3유형