describe로 데이터를 요약해보고 피어슨 상관 계수를 구해 본 결과를 시각화 해봅니다. 피어슨 상관 계수는 두 변수의 공분산을 표준 편차의 곱으로 나눈 값입니다. # 메소드의 괄호()안에서 Shift + tab키를 누르시면 문서를 보실 수 있습니다. # hue는 데이터의 종류에 따라 다른 색으로 그래프를 표현합니다. # ci == Size of the confidence interval for the regression estimate # ci는 신뢰구간을 의미하며 0부터 100까지의 값을 가집니다. 만약 95라면 양극단의 5%값을 제외한 95%구간의 값을 표현합니다. # 여기에서는 위에서 그린 신뢰구간을 제외하고 그리도록 했습니다. sns.lmplot(x="x", y="y", data=df, hue="dataset", col="dataset", ci=None) # height는 그래프의 높이를 의미합니다 # scatter_kws에서 s는 점의 크기를, alpha는 투명도를 의미합니다. sns.lmplot(x="x", y="y", data=df, hue="dataset", col="dataset", col_wrap=2, ci=None, palette="muted", height=4, scatter_kws={"s": 70, "alpha": 0.8}) # seaborn 사이트에 있는 예제의 그래프를 이해하기 위해 위에서는 옵션을 하나씩 그려봤습니다.
댓글
댓글 쓰기