pandas 학습 10단계 통합본 · 출력 결과 산출 서술형 문항

Question 1

문항: 아래 코드를 실행했을 때, 예시 2~10에서 출력되는 Series/DataFrame/columns/index/values/dtypes의 핵심 결과를 순서대로 서술하시오.

Answer

예시 정답 및 풀이
pandas 버전이 먼저 출력된다. Series [10,20,30]은 기본 인덱스 0,1,2와 함께 출력된다. 국어 90, 영어 85, 수학 100 Series가 출력된다. 민수 90, 지아 95, 하준 88 Series가 출력된다. DataFrame은 이름과 점수 열을 가진 3행 표로 출력된다. columns는 Index(['이름','점수'], dtype='object'), index는 RangeIndex(start=0, stop=2, step=1), values는 [['민수',90],['지아',95]], dtypes는 이름 object, 점수 int64이다.

Question 2

문항: 아래 코드를 실행했을 때 head(), tail(), shape, info(), describe(), mean(), max/min, unique(), value_counts()가 각각 어떤 결과를 출력하는지 서술하시오.

Answer

예시 정답 및 풀이
head()는 처음 5행, head(3)은 처음 3행, tail()은 마지막 5행을 보여준다. shape는 (3, 2)이다. info()는 열 이름, 결측치가 아닌 값 개수, 자료형을 보여준다. describe()는 count, mean, std, min, 사분위수, max를 출력한다. 국어 평균은 80.0, 수학 평균은 약 93.33이다. 점수 최댓값은 100, 최솟값은 76이다. unique()는 1반, 2반, 3반을 출력하고 value_counts()는 1반 2개, 2반 2개, 3반 1개를 출력한다.

Question 3

문항: 아래 코드를 실행했을 때 선택되는 행과 열, 조건에 의해 남는 데이터가 무엇인지 순서대로 서술하시오.

Answer

예시 정답 및 풀이
이름 열만 선택하면 민수, 지아, 하준이 Series로 출력된다. 여러 열 선택은 이름과 수학 열만 표로 출력된다. iloc[0]은 첫 번째 행 민수 90을 출력한다. iloc[1:3]은 지아와 하준 행을 출력한다. loc['b']는 지아 95를 출력하고 loc['b','점수']는 95를 출력한다. 점수 90 이상 조건은 민수와 지아, 이름이 김으로 시작하는 조건은 김민수와 김하준, isin 조건은 1반과 3반 행만 남긴다.

Question 4

문항: 아래 코드를 실행했을 때 새로 만들어지는 열, 수정되는 값, 삭제되는 행·열의 결과를 순서대로 서술하시오.

Answer

예시 정답 및 풀이
합격 열이 True로 추가된다. 국어+수학으로 합계 열이 생긴다. 평균 열에는 95.0, 87.5가 들어간다. 점수 80 이상은 합격, 80 미만은 불합격으로 결과 열이 생긴다. loc[0,'점수']=100으로 민수 점수가 100이 된다. 점수 80 미만인 지아에게 보충=필요가 들어가고 나머지는 NaN이다. 하준 행이 추가된다. name/score 열은 이름/점수로 바뀐다. 임시 열은 삭제되고, index 1 행인 지아가 삭제된다.

Question 5

문항: 아래 코드를 실행했을 때 결측치 확인, 결측치 처리, 중복 확인·제거 결과를 순서대로 서술하시오.

Answer

예시 정답 및 풀이
isna()는 점수가 None인 지아 행만 True로 표시한다. isna().sum()은 이름 0, 점수 1을 출력한다. dropna()는 결측치가 있는 지아 행을 제거한다. fillna(0)은 지아 점수를 0으로 채운다. 평균 채우기는 None을 92.666...으로 채운다. 문자 결측치는 이름없음으로 채운다. duplicated()는 두 번째 민수 행만 True이다. drop_duplicates()는 완전 중복 행을 제거한다. subset=['이름'] 기준 중복 제거는 첫 번째 민수만 남긴다. reset_index(drop=True)는 인덱스를 0부터 다시 정리한다.

Question 6

문항: 아래 코드를 실행했을 때 오름차순·내림차순 정렬 결과, 순위, 상위·하위 데이터가 어떻게 나오는지 서술하시오.

Answer

예시 정답 및 풀이
점수 오름차순은 하준 88, 민수 90, 지아 95 순서이다. 내림차순은 지아 95, 민수 90, 하준 88 순서이다. 여러 열 기준 정렬은 반은 오름차순, 점수는 반 안에서 내림차순이다. sort_index()는 a,b,c 순서로 정렬한다. reset_index(drop=True)는 정렬 후 인덱스를 0,1,2로 바꾼다. rank(ascending=False)는 지아 1, 민수 2, 하준 3이다. 동점 method='min'에서는 90점 두 명이 공동 1위, 80점은 3위이다. nlargest(3)은 지아, 서연, 민수이고 nsmallest(2)는 하준, 민수이다.

Question 7

문항: 아래 코드를 실행했을 때 반별 평균·합계·인원수·여러 통계·최고 학생 결과를 서술하시오.

Answer

예시 정답 및 풀이
반별 평균은 1반 85.0, 2반 90.0이다. 반별 합계는 1반 170, 2반 180이다. 반별 인원수는 1반 2명, 2반 3명이다. agg(['mean','max','min'])은 반별 평균·최댓값·최솟값을 표로 출력한다. 여러 열 집계는 반별 국어와 수학 평균을 출력한다. 두 기준 그룹화는 반과 성별 조합별 평균을 출력한다. reset_index()는 그룹 결과를 일반 표로 바꾼다. idxmax()는 1반 민수, 2반 하준을 최고 학생으로 찾는다. 합격 조건 후 그룹화는 1반 1명, 2반 2명을 출력한다. 사용자 정의 집계는 각 반의 점수 범위 10을 출력한다.

Question 8

문항: 아래 코드를 실행했을 때 문자열 처리와 날짜 처리 결과가 어떻게 바뀌는지 서술하시오.

Answer

예시 정답 및 풀이
str.strip()은 이름 앞뒤 공백을 제거한다. str.lower()는 아이디를 모두 소문자로 바꾼다. contains('김')은 김민수와 김하준 행을 남긴다. split(expand=True)는 주소를 시도와 지역 열로 나눈다. replace()는 고를 고등학교로 바꾼다. to_datetime() 후 날짜 열의 자료형은 datetime64이다. dt.year는 2026, 2025를 추출한다. dt.month와 dt.day는 월·일을 만든다. dayofweek는 월요일 0, 화요일 1로 출력된다. 날짜 차이는 9일이다.

Question 9

문항: 아래 코드를 실행했을 때 CSV/Excel 저장·읽기, concat, merge 결과가 어떻게 출력되는지 서술하시오.

Answer

예시 정답 및 풀이
score.csv 저장 후 저장 완료가 출력된다. read_csv는 민수 90, 지아 95 표를 읽어 출력한다. Excel 저장 후 엑셀 저장 완료가 출력되고 read_excel도 같은 표를 읽는다. 세로 concat은 민수와 지아가 행으로 이어진다. 가로 concat은 이름 열 옆에 점수 열이 붙는다. merge(on='이름')는 이름 기준으로 점수와 동아리를 결합한다. left merge는 하준의 동아리가 NaN으로 남는다. inner merge는 공통 이름 지아만 남는다. outer merge는 민수, 지아, 하준 전체가 남고 없는 값은 NaN이다.

Question 10

문항: 아래 코드를 실행했을 때 피벗 테이블, 등급 구간, 상관계수, 시계열, 이동평균, query/eval 결과를 서술하시오.

Answer

예시 정답 및 풀이
피벗 평균은 반을 행, 과목을 열로 하여 국어/수학 점수를 보여준다. 피벗 합계는 월별 품목 A/B 매출 합계를 보여준다. pd.cut은 55 하, 68 중, 75 중, 84 상, 92 상 등급을 만든다. corr()는 공부시간과 점수 사이의 양의 상관계수를 출력한다. date_range는 2026-06-01부터 5일간 날짜 인덱스를 만든다. resample('ME')는 1월 300, 2월 300 매출 합계를 만든다. rolling(3).mean()은 처음 두 행은 NaN, 이후 80.0, 85.0, 90.0이다. query는 민수와 지아를 남기고 eval은 합계 190, 175를 만든다. 마지막 summary는 반별 mean, max, min 표를 저장하고 출력한다.

pandas 학습 10단계 통합본 · 출력 결과 산출 서술형 문항

1단계 pandas 기초: Series와 DataFrame 생성

2단계 데이터 확인: head, tail, info, describe

3단계 데이터 선택: 열, 행, 조건 검색

4단계 데이터 수정: 열 추가, 값 수정, 행·열 삭제

5단계 결측치와 중복 처리

6단계 정렬과 순위

7단계 그룹화와 집계

8단계 문자열과 날짜 처리

9단계 파일 입출력과 데이터 병합

10단계 심화 분석: 피벗, 구간화, 상관, 시계열