OPENING
🚀 수업 시작 멘트
케플러는 티코 브라헤가 모은 방대한 행성 위치 데이터에서 “행성은 타원 궤도로 돈다”는 패턴을 발견했습니다. 오늘 우리는 데이터라는 밤하늘에서 통찰을 찾아내는 데이터 과학자가 되어, 문제 정의 → 데이터 준비 → 모델 학습 → 평가 → 튜닝의 전체 과정을 경험합니다.
OBJECTIVES
🎯 목표지향적 학습 목표
🧠 개념적 목표
기계학습 프로젝트 워크플로우, 특성 공학, 특성 스케일링, 하이퍼파라미터와 튜닝의 의미를 설명한다.
🛠 절차적 목표
pandas, StandardScaler, train_test_split, fit, predict, accuracy_score의 흐름을 코드로 이해한다.
🌱 태도적 목표
한 번에 완벽한 모델을 기대하지 않고, 평가와 튜닝을 반복하는 데이터 기반 문제 해결 태도를 기른다.
CONCEPTS
💡 핵심 개념 정리
1. 기계학습 워크플로우
기계학습 문제 해결은 일반적으로 문제 정의 → 데이터 수집·탐색 → 전처리 → 데이터 분할 → 모델 학습 → 평가 → 튜닝의 순서로 진행됩니다.
2. 전처리와 모델 개선
기존 변수를 조합하거나 가공하여 새로운 특성을 만든다. 예: 키와 몸무게로 BMI 만들기.
값의 범위가 다른 특성들을 공정하게 비교하도록 조정한다.
데이터를 평균 0, 표준편차 1에 가깝게 변환한다.
max_depth, C, k처럼 사람이 설정하는 값을 바꾸며 모델 성능을 개선한다.
3. 프로젝트 흐름표
| 단계 | 핵심 코드/활동 | 의미 |
|---|---|---|
| 문제 정의 | 분류/회귀 결정 | 무엇을 예측할지 정한다 |
| 데이터 준비 | read_csv, info, describe | 데이터 구조와 품질 확인 |
| 전처리 | fillna, StandardScaler | 결측치·스케일 문제 해결 |
| 모델 학습 | model.fit | 패턴 학습 |
| 평가 | accuracy_score | 테스트 성능 측정 |
| 튜닝 | max_depth 변경 | 성능 개선 실험 |
LESSON FLOW
🧭 수업 흐름
도입 5분
최고의 쿠키 레시피 비유로 알고리즘, 데이터, 하이퍼파라미터의 관계를 설명한다.
개념 전개 15분
워크플로우, 특성 공학, 스케일링, 튜닝의 역할을 비교한다.
코드 실습 20분
작은 데이터 예제로 스케일링, 모델 비교, 정확도 계산, 튜닝 결과를 해석한다.
평가 및 정리 10분
코드 출력 서술형, OX, 5지선다형을 풀고 TXT 결과를 제출한다.
CORE EXAMPLE
🐍 핵심 예제 코드
from sklearn.preprocessing import StandardScaler
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
X_train = [[10, 1000], [20, 2000], [30, 3000], [40, 4000]]
y_train = [0, 0, 1, 1]
X_test = [[25, 2500], [35, 3500]]
y_test = [1, 1]
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
model = DecisionTreeClassifier(max_depth=2, random_state=42)
model.fit(X_train_scaled, y_train)
pred = model.predict(X_test_scaled)
acc = accuracy_score(y_test, pred)
print(pred.tolist())
print(f"{acc:.2f}")
CODE OUTPUT WRITING
✍️ 코드 보여주고 출력결과 입력 받는 서술형 코드 10문항
출력 결과가 예시 정답과 정확히 일치하면 각 3점입니다. 공백은 줄 단위로 정리하여 비교합니다.
OX QUIZ
✅ OX 퀴즈 10개
MULTIPLE CHOICE
📝 5지선다형 10개
SUBMIT