DataFrame 시각화 심화형 5지선다 평가

평가 안내
각 문항은 코드와 실제 출력 그래프를 함께 보고 푸는 심화형 5지선다입니다. 채점 후 학번_이름_시각화_점수_응시시각.txt 파일이 자동 다운로드됩니다.

직선 그래프 분석형

1. 1. 일주일 평균 기온 변화

실선, 원형 마커, 평균선, 최고점 주석을 조합한 직선 그래프입니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'요일': ['월', '화', '수', '목', '금', '토', '일'], '기온': [18, 19, 21, 20, 23, 24, 22]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["요일"], df["기온"],
         color="royalblue", marker="o", linewidth=3, markersize=8, label="평균 기온")
plt.axhline(df["기온"].mean(), color="gray", linestyle=":", label="평균선")
plt.annotate("최고 기온", xy=("토", 24), xytext=("금", 25),
             arrowprops=dict(arrowstyle="->"))
plt.title("1. 일주일 평균 기온 변화")
plt.xlabel("요일")
plt.ylabel("기온(℃)")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

이 코드와 그래프를 해석한 설명으로 가장 적절한 것은?

1토요일이 최고 기온이며, 원형 마커와 굵은 선이 변화 추세를 강조한다.2평균선은 월요일 값 18만 표시한다.3marker='o'는 그래프를 막대그래프로 바꾼다.4annotate는 x축 이름을 바꾸는 함수이다.5grid는 DataFrame의 행을 추가한다.

정답: 1번
상세 설명: 토요일 기온 24가 최댓값입니다. marker='o'는 원형 점, linewidth=3은 선을 굵게 하여 추세를 강조합니다.

직선 그래프 코드해석형

2. 2. 월별 전기 사용량 변화

점선, 사각형 마커, 투명도, 평균선을 결합했습니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'월': ['1월', '2월', '3월', '4월', '5월', '6월'], '전기사용량': [210, 198, 185, 176, 190, 230]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["월"], df["전기사용량"],
         color="tomato", linestyle="--", marker="s", linewidth=3, alpha=0.85, label="전기 사용량")
plt.axhline(df["전기사용량"].mean(), color="gray", linestyle=":", label="평균선")
plt.title("2. 월별 전기 사용량 변화")
plt.xlabel("월")
plt.ylabel("전기사용량(kWh)")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

평균선을 추가한 목적을 가장 잘 설명한 것은?

1각 월의 전기사용량을 같은 값으로 수정하기 위해서이다.2평균보다 높은 달과 낮은 달을 시각적으로 비교하기 위해서이다.3x축 월 이름을 자동으로 숫자로 바꾸기 위해서이다.4점선을 실선으로 바꾸기 위해서이다.5범례를 삭제하기 위해서이다.

정답: 2번
상세 설명: axhline(df['전기사용량'].mean())은 평균 위치에 수평선을 그립니다. 평균보다 높은 달과 낮은 달을 비교할 때 유용합니다.

직선 그래프 시각요소판단형

3. 3. 하루 물 섭취량 누적

파선, 다이아몬드 마커, 면적 채우기, 값 표시를 조합했습니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'시간': ['8시', '10시', '12시', '14시', '16시', '18시'], '물섭취량': [200, 450, 700, 950, 1200, 1500]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["시간"], df["물섭취량"],
         color="deepskyblue", linestyle="-.", marker="D", linewidth=2.5, label="누적 섭취량")
plt.fill_between(df["시간"], df["물섭취량"], alpha=0.18)
for x, y in zip(df["시간"], df["물섭취량"]):
    plt.text(x, y, str(y), ha="center", va="bottom")
plt.title("3. 하루 물 섭취량 누적")
plt.xlabel("시간")
plt.ylabel("물섭취량(mL)")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

fill_between과 text를 함께 사용한 효과로 가장 적절한 것은?

1선 아래 면적은 누적 증가감을 강조하고, text는 실제 값을 직접 보여준다.2fill_between은 결측치를 제거한다.3text는 y축 단위를 자동 변환한다.4두 함수 모두 그래프를 정렬한다.5fill_between은 범례만 만든다.

정답: 1번
상세 설명: fill_between은 선 아래 영역을 채워 시각적 흐름을 강조하고, text는 각 지점의 정확한 수치를 보여줍니다.

직선 그래프 비교형

4. 4. 시험 전 공부 시간 변화

굵은 선, 삼각형 마커, 급증 지점 주석을 사용했습니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'남은날짜': ['D-5', 'D-4', 'D-3', 'D-2', 'D-1'], '공부시간': [2, 3, 4, 5, 7]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["남은날짜"], df["공부시간"],
         color="purple", marker="^", linewidth=5, markersize=9, label="공부 시간")
plt.annotate("공부 시간 급증", xy=("D-1", 7), xytext=("D-2", 8),
             arrowprops=dict(arrowstyle="->"))
plt.title("4. 시험 전 공부 시간 변화")
plt.xlabel("남은날짜")
plt.ylabel("공부시간")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

이 그래프에서 시각 요소와 데이터 해석이 바르게 연결된 것은?

1linewidth=5는 공부시간을 5배로 늘린다.2굵은 선과 삼각형 마커는 시험 직전 증가 추세를 강조한다.3annotate는 최솟값만 자동으로 찾는다.4marker='^'는 평균선을 만든다.5grid는 데이터 값을 변경한다.

정답: 2번
상세 설명: 값이 D-5부터 D-1까지 증가합니다. 굵은 선과 삼각형 마커는 상승 추세를 눈에 띄게 만듭니다.

직선 그래프 주의점판단형

5. 5. 카페 방문자 수 변화

별 마커와 주말 급증 주석을 활용했습니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'요일': ['월', '화', '수', '목', '금', '토', '일'], '방문자수': [80, 95, 100, 110, 150, 210, 190]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["요일"], df["방문자수"],
         color="darkorange", marker="*", linewidth=2.8, markersize=13, label="방문자 수")
plt.annotate("주말 방문자 급증", xy=("토", 210), xytext=("금", 225),
             arrowprops=dict(arrowstyle="->"))
plt.title("5. 카페 방문자 수 변화")
plt.xlabel("요일")
plt.ylabel("방문자수")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

주말 효과를 분석할 때 가장 타당한 설명은?

1토요일 방문자 수가 가장 많아 주말 증가가 뚜렷하다.2월요일 방문자가 가장 많다.3금요일에서 토요일로 방문자 수가 감소한다.4일요일이 토요일보다 많다.5별 마커는 평균값으로 변환한다.

정답: 1번
상세 설명: 토요일 210명이 최댓값이며 금요일 150명에서 크게 증가합니다.

직선 그래프 분석형

6. 6. 스마트폰 사용 시간 변화

소수 데이터, 기준선, 원형 마커를 조합했습니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'날짜': ['1일', '2일', '3일', '4일', '5일', '6일'], '사용시간': [3.2, 4.1, 2.8, 5.0, 4.6, 3.7]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["날짜"], df["사용시간"],
         color="crimson", marker="o", linewidth=2.5, markersize=8, label="사용 시간")
plt.axhline(4, color="green", linestyle="--", label="권장 기준 4시간")
plt.title("6. 스마트폰 사용 시간 변화")
plt.xlabel("날짜")
plt.ylabel("사용시간")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

권장 기준선 4시간을 기준으로 옳은 해석은?

12일, 4일, 5일은 기준 이상이다.23일은 기준 이상이다.3모든 날짜가 기준보다 낮다.4axhline(4)는 x=4 위치의 세로선을 그린다.5소수 데이터는 선 그래프로 표현할 수 없다.

정답: 1번
상세 설명: 2일 4.1, 4일 5.0, 5일 4.6은 4시간 이상입니다. axhline은 y축 기준 수평선입니다.

직선 그래프 코드해석형

7. 7. 버스 평균 대기 시간

얇은 선, x 마커, 최댓값 주석을 활용했습니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'정류장': ['A', 'B', 'C', 'D', 'E', 'F'], '대기시간': [7, 9, 5, 11, 6, 8]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["정류장"], df["대기시간"],
         color="seagreen", marker="x", linewidth=1.8, markersize=10, label="대기 시간")
plt.annotate("가장 긴 대기", xy=("D", 11), xytext=("C", 12),
             arrowprops=dict(arrowstyle="->"))
plt.title("7. 버스 평균 대기 시간")
plt.xlabel("정류장")
plt.ylabel("대기시간(분)")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

정류장별 대기시간 그래프에 대한 설명으로 옳은 것은?

1D 정류장의 대기시간이 가장 길며 주석으로 강조된다.2C 정류장이 가장 긴 대기시간을 가진다.3marker='x'는 값이 0인 지점만 표시한다.4plt.plot은 범주형 x축을 사용할 수 없다.5색상은 단위를 분에서 초로 바꾼다.

정답: 1번
상세 설명: D 정류장의 값 11이 최댓값이며 annotate로 강조했습니다.

직선 그래프 시각요소판단형

8. 8. 독서 페이지 수 변화

면적 채우기로 독서량 흐름을 강조합니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'요일': ['월', '화', '수', '목', '금', '토'], '페이지': [20, 35, 30, 45, 60, 72]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["요일"], df["페이지"],
         color="mediumvioletred", marker="o", linewidth=3, label="읽은 페이지")
plt.fill_between(df["요일"], df["페이지"], alpha=0.18)
plt.title("8. 독서 페이지 수 변화")
plt.xlabel("요일")
plt.ylabel("페이지")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

fill_between을 사용하는 주된 이유는?

1선 아래 영역을 채워 독서량 변화의 크기와 흐름을 강조하기 위해서이다.2페이지 수를 누적합으로 자동 계산하기 위해서이다.3요일 열을 삭제하기 위해서이다.4마커를 사각형으로 바꾸기 위해서이다.5범례를 숨기기 위해서이다.

정답: 1번
상세 설명: fill_between은 데이터 자체를 바꾸지 않고 선 아래를 채워 변화의 양감을 시각적으로 강조합니다.

직선 그래프 비교형

9. 9. 운동 거리 변화

목표선과 삼각형 마커로 목표 달성 여부를 표현합니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'날짜': ['월', '화', '수', '목', '금', '토'], '거리': [1.2, 2.0, 1.8, 2.5, 3.1, 4.0]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["날짜"], df["거리"],
         color="teal", marker="^", linewidth=3, markersize=8, label="운동 거리")
plt.axhline(3, color="green", linestyle="--", label="목표선 3km")
plt.title("9. 운동 거리 변화")
plt.xlabel("날짜")
plt.ylabel("거리(km)")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

목표선 3km를 기준으로 올바른 해석은?

1금요일과 토요일은 목표선을 넘는다.2월요일부터 목요일까지 모두 목표선을 넘는다.3목표선은 x축 기준선이다.4토요일은 목표선보다 낮다.5marker='^'는 기준선을 삭제한다.

정답: 1번
상세 설명: 금요일 3.1km, 토요일 4.0km는 y=3 목표선보다 높습니다.

직선 그래프 주의점판단형

10. 10. 학급 평균 점수 변화

계단형 선 그래프로 단계적 향상을 표현합니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'단원': ['1단원', '2단원', '3단원', '4단원', '5단원'], '평균점수': [72, 76, 81, 85, 88]})

plt.figure(figsize=(7.4, 4.6))
plt.plot(df["단원"], df["평균점수"],
         color="navy", drawstyle="steps-post", marker="o", linewidth=3, label="평균 점수")
plt.axhline(df["평균점수"].mean(), color="gray", linestyle=":", label="평균선")
plt.title("10. 학급 평균 점수 변화")
plt.xlabel("단원")
plt.ylabel("평균점수")
plt.grid(True, linestyle=":", alpha=0.5)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

drawstyle='steps-post'의 효과로 가장 적절한 것은?

1단원별 값이 단계적으로 상승하는 형태로 보인다.2모든 점을 별 모양으로 바꾼다.3평균점수를 자동 정렬한다.4y축 최댓값을 100으로 고정한다.5선 아래를 색칠한다.

정답: 1번
상세 설명: steps-post는 점 사이를 계단형으로 연결하여 단원별 단계적 변화를 표현합니다.

막대 그래프 분석형

11. 1. 과일 판매량

세로 막대, 서로 다른 색, 테두리, 값 표시, 최고값 주석

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'과일': ['사과', '바나나', '포도', '딸기'], '판매량': [35, 28, 22, 40]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["과일"], df["판매량"], color=["#60a5fa", "#34d399", "#fbbf24", "#f87171"], edgecolor="black", linewidth=1.2, label="판매량")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["판매량"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.annotate("최고 판매", xy=('딸기', 40), xytext=('포도', 44),
             arrowprops=dict(arrowstyle="->"))

plt.title("1. 과일 판매량")
plt.xlabel("과일")
plt.ylabel("판매량")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

막대 위 값 표시와 최고값 주석을 함께 사용하는 이유로 가장 적절한 것은?

1각 항목의 정확한 수치와 가장 큰 항목을 동시에 파악하기 위해서이다.2색상을 모두 같은 색으로 바꾸기 위해서이다.3DataFrame 행을 삭제하기 위해서이다.4막대그래프를 선그래프로 바꾸기 위해서이다.5x축과 y축을 자동 교환하기 위해서이다.

정답: 1번
상세 설명: 값 표시로 각 판매량을 정확히 읽고, 주석으로 최댓값인 딸기를 빠르게 확인할 수 있습니다.

막대 그래프 코드해석형

12. 2. 교통수단 이용자 수

가로 막대, 값 라벨, x축 격자

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'교통수단': ['버스', '지하철', '자전거', '도보'], '이용자수': [120, 160, 55, 80]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.barh(df["교통수단"], df["이용자수"], color="#38bdf8", edgecolor="black", alpha=0.86, label="이용자수")
for bar in bars:
    width = bar.get_width()
    plt.text(width + max(df["이용자수"]) * 0.02,
             bar.get_y() + bar.get_height()/2,
             f"{int(width):,}", va="center")

plt.title("2. 교통수단 이용자 수")
plt.xlabel("교통수단")
plt.ylabel("이용자수")
plt.grid(True, axis="x", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

plt.barh를 선택한 이유로 가장 타당한 것은?

1범주 이름을 세로축에 두고 길이로 이용자 수를 비교하기 좋기 때문이다.2시간 흐름을 반드시 나타내기 위해서이다.3막대 높이를 모두 0으로 만들기 위해서이다.4범례를 사용할 수 없기 때문이다.5x축 값이 문자열이면 bar는 사용할 수 없기 때문이다.

정답: 1번
상세 설명: barh는 항목명이 길거나 범주 비교가 많을 때 가독성이 좋습니다.

막대 그래프 시각요소판단형

13. 3. 과목별 평균 점수

패턴 막대, 85점 기준선, 값 표시

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'과목': ['국어', '수학', '영어', '과학'], '평균': [82, 88, 79, 91]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["과목"], df["평균"], color="#a78bfa", edgecolor="black", hatch="//", label="평균")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["평균"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.axhline(85, color="red", linestyle="--", label="기준선")

plt.title("3. 과목별 평균 점수")
plt.xlabel("과목")
plt.ylabel("평균")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

기준선 85점을 기준으로 한 해석 중 옳은 것은?

1수학과 과학은 기준선 이상이다.2국어와 영어만 기준선 이상이다.3모든 과목이 기준선 미만이다.4hatch='//'는 점수를 모두 85로 만든다.5axhline(85)는 x=85 위치 세로선을 그린다.

정답: 1번
상세 설명: 수학 88, 과학 91은 기준선 85보다 높습니다. axhline은 수평선을 그립니다.

막대 그래프 비교형

14. 4. 월별 용돈 사용액

원 단위 데이터, 평균선, 점 패턴

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'월': ['3월', '4월', '5월', '6월'], '사용액': [45000, 52000, 48000, 61000]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["월"], df["사용액"], color="#fb7185", edgecolor="black", hatch="..", alpha=0.86, label="사용액")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["사용액"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.axhline(df["사용액"].mean(), color="gray", linestyle=":", label="평균선")

plt.title("4. 월별 용돈 사용액")
plt.xlabel("월")
plt.ylabel("사용액(원)")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

평균선을 활용한 해석으로 가장 적절한 것은?

1각 월의 사용액이 평균보다 많은지 적은지 비교할 수 있다.2월 이름을 영어로 번역한다.3막대 색을 제거한다.4사용액을 모두 같은 값으로 수정한다.5x축 글자를 삭제한다.

정답: 1번
상세 설명: 평균선은 전체 기준 역할을 하므로 평균 초과 여부를 판단하는 데 좋습니다.

막대 그래프 주의점판단형

15. 5. 동아리 회원 수

좁은 막대 폭, xx 패턴, 값 표시

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'동아리': ['코딩', '축구', '밴드', '과학'], '회원수': [24, 31, 18, 27]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["동아리"], df["회원수"], width=0.5, color="#34d399", edgecolor="black", hatch="xx", label="회원수")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["회원수"]) * 0.025,
             f"{int(height):,}", ha="center")

plt.title("5. 동아리 회원 수")
plt.xlabel("동아리")
plt.ylabel("회원수")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

width=0.5와 hatch='xx'의 역할을 바르게 설명한 것은?

1width는 막대 폭, hatch는 막대 내부 패턴을 조절한다.2width는 회원수를 절반으로 줄인다.3hatch는 x축 이름을 바꾼다.4둘 다 DataFrame 열 이름을 수정한다.5둘 다 막대를 선그래프로 바꾼다.

정답: 1번
상세 설명: width는 막대 폭을, hatch는 막대 안쪽 무늬를 지정합니다.

막대 그래프 분석형

16. 6. 지역별 미세먼지

주의 기준선, 색상 조합, 주석

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'지역': ['서울', '전주', '부산', '대구'], '미세먼지': [42, 35, 29, 50]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["지역"], df["미세먼지"], color=["#facc15", "#86efac", "#93c5fd", "#fb7185"], edgecolor="black", label="미세먼지")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["미세먼지"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.axhline(40, color="red", linestyle="--", label="기준선")
plt.annotate("주의 필요", xy=('대구', 50), xytext=('부산', 55),
             arrowprops=dict(arrowstyle="->"))

plt.title("6. 지역별 미세먼지")
plt.xlabel("지역")
plt.ylabel("미세먼지(㎍/㎥)")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

주의 기준선 40을 기준으로 옳은 해석은?

1서울과 대구는 기준선을 넘는다.2전주와 부산은 기준선을 넘는다.3모든 지역이 기준선보다 낮다.4색상 때문에 값이 바뀐다.5axhline(40)은 x축 40번째 항목이다.

정답: 1번
상세 설명: 서울 42, 대구 50은 기준선 40을 넘습니다.

막대 그래프 코드해석형

17. 7. 음식별 칼로리

가로 막대, kcal 값 라벨

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'음식': ['김밥', '라면', '샐러드', '비빔밥'], '칼로리': [420, 510, 180, 650]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.barh(df["음식"], df["칼로리"], color="#f97316", edgecolor="black", alpha=0.86, label="칼로리")
for bar in bars:
    width = bar.get_width()
    plt.text(width + max(df["칼로리"]) * 0.02,
             bar.get_y() + bar.get_height()/2,
             f"{int(width):,}", va="center")

plt.title("7. 음식별 칼로리")
plt.xlabel("음식")
plt.ylabel("칼로리(kcal)")
plt.grid(True, axis="x", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

가로 막대에서 get_width()로 값을 표시하는 이유는?

1barh에서 막대 길이가 x축 값이므로 막대 끝에 수치를 붙이기 위해서이다.2get_width는 음식 이름의 글자 수이다.3width는 항상 0이다.4barh에서는 텍스트를 표시할 수 없다.5막대 높이가 칼로리값이기 때문이다.

정답: 1번
상세 설명: barh의 값은 막대의 가로 길이이므로 get_width()로 실제 수치를 읽어 표시합니다.

막대 그래프 시각요소판단형

18. 8. 앱별 사용 시간

사선 패턴, 60분 기준선, 투명도

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'앱': ['유튜브', '카톡', '게임', '검색'], '사용시간': [95, 60, 45, 35]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["앱"], df["사용시간"], color="#818cf8", edgecolor="black", hatch="\\", alpha=0.75, label="사용시간")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["사용시간"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.axhline(60, color="red", linestyle="--", label="기준선")

plt.title("8. 앱별 사용 시간")
plt.xlabel("앱")
plt.ylabel("사용시간(분)")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

60분 기준선으로 볼 때 올바른 분석은?

1유튜브는 기준선을 넘고 카톡은 기준선과 같다.2검색은 기준선을 넘는다.3게임은 기준선보다 높다.4모든 앱이 기준선보다 낮다.5hatch는 기준선을 없앤다.

정답: 1번
상세 설명: 유튜브 95분은 기준 초과, 카톡 60분은 기준과 같습니다.

막대 그래프 비교형

19. 9. 학년별 학생 수

넓은 막대, y축 범위 조절, 값 표시

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'학년': ['1학년', '2학년', '3학년'], '학생수': [125, 118, 130]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["학년"], df["학생수"], width=0.8, color="#22c55e", edgecolor="black", hatch="--", label="학생수")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["학생수"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.ylim(100, 140)

plt.title("9. 학년별 학생 수")
plt.xlabel("학년")
plt.ylabel("학생수")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

plt.ylim(100, 140)을 사용할 때 주의할 점은?

1차이가 더 크게 보일 수 있으므로 y축 시작값을 확인해야 한다.2학생 수가 실제로 100명씩 줄어든다.3막대 색이 자동으로 빨간색이 된다.4x축이 숫자로 바뀐다.5그래프가 가로 막대로 변한다.

정답: 1번
상세 설명: y축을 0이 아닌 100부터 시작하면 차이가 시각적으로 과장될 수 있습니다.

막대 그래프 주의점판단형

20. 10. 쇼핑 품목별 지출 금액

금액 데이터, 최고 지출 주석, 평균선

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'품목': ['문구', '의류', '간식', '도서'], '금액': [15000, 62000, 18000, 32000]})

plt.figure(figsize=(7.4, 4.6))
bars = plt.bar(df["품목"], df["금액"], color="#f472b6", edgecolor="black", hatch="oo", alpha=0.86, label="금액")
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2,
             height + max(df["금액"]) * 0.025,
             f"{int(height):,}", ha="center")
plt.axhline(df["금액"].mean(), color="gray", linestyle=":", label="평균선")
plt.annotate("최고 지출", xy=('의류', 62000), xytext=('간식', 68000),
             arrowprops=dict(arrowstyle="->"))

plt.title("10. 쇼핑 품목별 지출 금액")
plt.xlabel("품목")
plt.ylabel("금액(원)")
plt.grid(True, axis="y", linestyle="--", alpha=0.4)
plt.legend()
plt.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

평균 지출선과 최고 지출 주석을 함께 볼 때 가장 적절한 해석은?

1의류 지출이 가장 크고 평균 지출보다 높다.2문구 지출이 가장 크다.3도서 지출은 의류보다 높다.4평균선은 가장 높은 금액만 표시한다.5annotate는 금액 열을 삭제한다.

정답: 1번
상세 설명: 의류 62,000원이 최댓값이며 전체 평균보다 높습니다.

이중 y축 혼합 그래프 분석형

21. 1. 월별 매출과 광고비

왼쪽 y축은 막대 매출, 오른쪽 y축은 직선 광고비입니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'월': ['1월', '2월', '3월', '4월', '5월', '6월'], '매출': [120, 135, 128, 150, 170, 190], '광고비': [20, 25, 22, 30, 35, 40]})

fig, ax1 = plt.subplots(figsize=(7.4, 4.6))

# 왼쪽 y축: 막대그래프
bars = ax1.bar(df["월"], df["매출"],
               color="#93c5fd", edgecolor="black",
               alpha=0.85, label="매출(만원)")
ax1.set_xlabel("월")
ax1.set_ylabel("매출(만원)", color="royalblue")
ax1.tick_params(axis="y", labelcolor="royalblue")
ax1.grid(True, axis="y", linestyle="--", alpha=0.35)

for bar in bars:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2,
             height + max(df["매출"]) * 0.02,
             f"{height:g}", ha="center", fontsize=9)

# 오른쪽 y축: 직선그래프
ax2 = ax1.twinx()
ax2.plot(df["월"], df["광고비"],
         color="crimson", marker="o",
         linewidth=3, markersize=7,
         label="광고비(만원)")
ax2.set_ylabel("광고비(만원)", color="crimson")
ax2.tick_params(axis="y", labelcolor="crimson")

plt.title("1. 월별 매출과 광고비")

# 두 축의 범례 합치기
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax2.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc="upper left")

fig.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

이중 y축을 사용한 이유로 가장 적절한 것은?

1매출과 광고비처럼 단위와 크기가 다른 두 변수를 한 그래프에서 비교하기 위해서이다.2막대와 직선을 같은 y축으로 강제로 합치기 위해서이다.3광고비 데이터를 삭제하기 위해서이다.4x축을 두 개 만들기 위해서이다.5범례를 사용할 수 없기 때문이다.

정답: 1번
상세 설명: twinx는 같은 x축을 공유하면서 왼쪽과 오른쪽에 서로 다른 y축을 만들 수 있습니다.

이중 y축 혼합 그래프 코드해석형

22. 2. 주간 공부 시간과 집중도

왼쪽 y축은 막대 공부시간, 오른쪽 y축은 직선 집중도입니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'요일': ['월', '화', '수', '목', '금', '토', '일'], '공부시간': [2, 3, 2.5, 4, 3.5, 5, 4.5], '집중도': [65, 70, 68, 78, 75, 85, 82]})

fig, ax1 = plt.subplots(figsize=(7.4, 4.6))

# 왼쪽 y축: 막대그래프
bars = ax1.bar(df["요일"], df["공부시간"],
               color="#93c5fd", edgecolor="black",
               alpha=0.85, label="공부시간")
ax1.set_xlabel("요일")
ax1.set_ylabel("공부시간", color="royalblue")
ax1.tick_params(axis="y", labelcolor="royalblue")
ax1.grid(True, axis="y", linestyle="--", alpha=0.35)

for bar in bars:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2,
             height + max(df["공부시간"]) * 0.02,
             f"{height:g}", ha="center", fontsize=9)

# 오른쪽 y축: 직선그래프
ax2 = ax1.twinx()
ax2.plot(df["요일"], df["집중도"],
         color="crimson", marker="o",
         linewidth=3, markersize=7,
         label="집중도(점)")
ax2.set_ylabel("집중도(점)", color="crimson")
ax2.tick_params(axis="y", labelcolor="crimson")

plt.title("2. 주간 공부 시간과 집중도")

# 두 축의 범례 합치기
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax2.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc="upper left")

fig.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

이 그래프를 해석할 때 가장 주의해야 할 점은?

1공부시간과 집중도는 서로 다른 y축을 사용하므로 높이를 단순 비교하면 안 된다.2막대와 선은 반드시 같은 단위이다.3집중도는 왼쪽 y축을 기준으로 읽어야 한다.4공부시간은 오른쪽 y축을 기준으로 읽어야 한다.5twinx는 두 변수 값을 평균으로 합친다.

정답: 1번
상세 설명: 왼쪽 y축과 오른쪽 y축의 단위가 다르므로 막대 높이와 선 위치를 직접 같은 단위처럼 비교하면 안 됩니다.

이중 y축 혼합 그래프 시각요소판단형

23. 3. 지역별 강수량과 습도

왼쪽 y축은 막대 강수량, 오른쪽 y축은 직선 습도입니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'지역': ['서울', '전주', '부산', '대구', '광주'], '강수량': [12, 18, 30, 8, 22], '습도': [60, 65, 75, 55, 70]})

fig, ax1 = plt.subplots(figsize=(7.4, 4.6))

# 왼쪽 y축: 막대그래프
bars = ax1.bar(df["지역"], df["강수량"],
               color="#93c5fd", edgecolor="black",
               alpha=0.85, label="강수량(mm)")
ax1.set_xlabel("지역")
ax1.set_ylabel("강수량(mm)", color="royalblue")
ax1.tick_params(axis="y", labelcolor="royalblue")
ax1.grid(True, axis="y", linestyle="--", alpha=0.35)

for bar in bars:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2,
             height + max(df["강수량"]) * 0.02,
             f"{height:g}", ha="center", fontsize=9)

# 오른쪽 y축: 직선그래프
ax2 = ax1.twinx()
ax2.plot(df["지역"], df["습도"],
         color="crimson", marker="o",
         linewidth=3, markersize=7,
         label="습도(%)")
ax2.set_ylabel("습도(%)", color="crimson")
ax2.tick_params(axis="y", labelcolor="crimson")

plt.title("3. 지역별 강수량과 습도")

# 두 축의 범례 합치기
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax2.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc="upper left")

fig.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

강수량과 습도를 이중 y축으로 표현한 설명 중 옳은 것은?

1강수량은 왼쪽 y축, 습도는 오른쪽 y축을 기준으로 읽어야 한다.2습도는 막대의 높이로 읽는다.3강수량은 오른쪽 y축을 기준으로 읽어야 한다.4두 축의 단위가 같으므로 축 구분이 필요 없다.5twinx는 x축 항목을 삭제한다.

정답: 1번
상세 설명: 막대는 강수량(mm)으로 왼쪽 y축, 선은 습도(%)로 오른쪽 y축을 기준으로 읽습니다.

이중 y축 혼합 그래프 비교형

24. 4. 상품별 판매량과 만족도

왼쪽 y축은 막대 판매량, 오른쪽 y축은 직선 만족도입니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'상품': ['A', 'B', 'C', 'D', 'E'], '판매량': [80, 120, 90, 150, 110], '만족도': [3.8, 4.2, 3.9, 4.7, 4.3]})

fig, ax1 = plt.subplots(figsize=(7.4, 4.6))

# 왼쪽 y축: 막대그래프
bars = ax1.bar(df["상품"], df["판매량"],
               color="#93c5fd", edgecolor="black",
               alpha=0.85, label="판매량(개)")
ax1.set_xlabel("상품")
ax1.set_ylabel("판매량(개)", color="royalblue")
ax1.tick_params(axis="y", labelcolor="royalblue")
ax1.grid(True, axis="y", linestyle="--", alpha=0.35)

for bar in bars:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2,
             height + max(df["판매량"]) * 0.02,
             f"{height:g}", ha="center", fontsize=9)

# 오른쪽 y축: 직선그래프
ax2 = ax1.twinx()
ax2.plot(df["상품"], df["만족도"],
         color="crimson", marker="o",
         linewidth=3, markersize=7,
         label="만족도(5점)")
ax2.set_ylabel("만족도(5점)", color="crimson")
ax2.tick_params(axis="y", labelcolor="crimson")

plt.title("4. 상품별 판매량과 만족도")

# 두 축의 범례 합치기
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax2.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc="upper left")

fig.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

판매량과 만족도를 함께 볼 때 가장 적절한 해석 방식은?

1판매량 규모와 만족도 추세를 각각의 y축 기준으로 따로 읽고 관계를 살핀다.2만족도 4.7은 판매량 4.7개로 읽는다.3판매량은 오른쪽 y축 기준이다.4두 변수는 같은 단위이므로 축 색상은 의미 없다.5선 그래프가 막대 값을 자동 누적한다.

정답: 1번
상세 설명: 서로 단위가 다른 변수이므로 판매량은 왼쪽, 만족도는 오른쪽 축으로 읽고 상관 경향을 살펴야 합니다.

이중 y축 혼합 그래프 주의점판단형

25. 5. 월별 운동 횟수와 체중 변화

왼쪽 y축은 막대 운동횟수, 오른쪽 y축은 직선 체중입니다.

🐍 파이썬 코드

import pandas as pd
import matplotlib.pyplot as plt

# 한글 깨짐 방지 + 마이너스 기호 깨짐 방지
plt.rcParams["font.family"] = "NanumGothic"
plt.rcParams["axes.unicode_minus"] = False

df = pd.DataFrame({'월': ['1월', '2월', '3월', '4월', '5월', '6월'], '운동횟수': [8, 10, 12, 15, 18, 20], '체중': [72, 71.5, 71, 70.2, 69.8, 69.0]})

fig, ax1 = plt.subplots(figsize=(7.4, 4.6))

# 왼쪽 y축: 막대그래프
bars = ax1.bar(df["월"], df["운동횟수"],
               color="#93c5fd", edgecolor="black",
               alpha=0.85, label="운동횟수(회)")
ax1.set_xlabel("월")
ax1.set_ylabel("운동횟수(회)", color="royalblue")
ax1.tick_params(axis="y", labelcolor="royalblue")
ax1.grid(True, axis="y", linestyle="--", alpha=0.35)

for bar in bars:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2,
             height + max(df["운동횟수"]) * 0.02,
             f"{height:g}", ha="center", fontsize=9)

# 오른쪽 y축: 직선그래프
ax2 = ax1.twinx()
ax2.plot(df["월"], df["체중"],
         color="crimson", marker="o",
         linewidth=3, markersize=7,
         label="체중(kg)")
ax2.set_ylabel("체중(kg)", color="crimson")
ax2.tick_params(axis="y", labelcolor="crimson")

plt.title("5. 월별 운동 횟수와 체중 변화")

# 두 축의 범례 합치기
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax2.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc="upper left")

fig.tight_layout()
plt.show()

🖼️ 코드가 출력한 실제 그래프

🎯 코드와 그래프 관련 심화형 5지선다형

이 그래프에서 가장 타당한 분석은?

1운동횟수는 증가하고 체중은 감소하는 경향이 함께 보인다.2체중은 왼쪽 y축의 막대로 읽어야 한다.3운동횟수와 체중은 같은 단위이다.4twinx 때문에 x축 월 정보가 사라진다.5체중 선은 막대그래프의 평균선이다.

정답: 1번
상세 설명: 월이 지날수록 운동횟수 막대는 증가하고 체중 선은 감소하는 경향이 보입니다.