[todaycode오늘코드] [3/3] 파이썬 데이터 시각화 - seaborn lmplot과 regplot의 차이 신뢰구간의 의미와 hue 등 다양한 옵션 사용하기





describe로 데이터를 요약해보고 피어슨 상관 계수를 구해 본 결과를 시각화 해봅니다. 피어슨 상관 계수는 두 변수의 공분산을 표준 편차의 곱으로 나눈 값입니다. # 메소드의 괄호()안에서 Shift + tab키를 누르시면 문서를 보실 수 있습니다. # hue는 데이터의 종류에 따라 다른 색으로 그래프를 표현합니다. # ci == Size of the confidence interval for the regression estimate # ci는 신뢰구간을 의미하며 0부터 100까지의 값을 가집니다. 만약 95라면 양극단의 5%값을 제외한 95%구간의 값을 표현합니다. # 여기에서는 위에서 그린 신뢰구간을 제외하고 그리도록 했습니다. sns.lmplot(x="x", y="y", data=df, hue="dataset", col="dataset", ci=None) # height는 그래프의 높이를 의미합니다 # scatter_kws에서 s는 점의 크기를, alpha는 투명도를 의미합니다. sns.lmplot(x="x", y="y", data=df, hue="dataset", col="dataset", col_wrap=2, ci=None, palette="muted", height=4, scatter_kws={"s": 70, "alpha": 0.8}) # seaborn 사이트에 있는 예제의 그래프를 이해하기 위해 위에서는 옵션을 하나씩 그려봤습니다.

댓글

이 블로그의 인기 게시물

[이수안컴퓨터연구소] 파이썬 레이싱 자동차 게임 만들기 Creating a Python Racing Car Game with pygame (한글자막)

인간 피드백을 통한 강화학습 RLHF, Reinforcement Learning from Human Feedback