Bar Chart
DataFrame 형태로 반환
데이터가 리스트 형태로 있음을 가정
1 |
|
- 리스트를 시리즈 형태로 만들어서 concat을 axis =1 로 맞추어 합쳤다.
- 데이터는 Numeric type 이기 때문에 배열 정렬을 할 수 있어서 기본이 True인 선택값으로 넣어줬다.
Bar Chart with Seaborn
데이터가 데이터프레임 형태로 있음을 가정
1 |
|
- 들어온 데이터프레임은 sns.barplot으로 만들어준다. 여기서 x와 y는 df.columns[n]으로, 데이터프레임에서 특정 열을 뽑아 (시리즈) 지정해준다.
- 팔레트는 아무 색이나 넣어봤다
- rcParams 으로 차트를 다양하게 만질 수 있다길래 폰트 사이즈를 바꿨다.
저렇게 말고 다르게 바꿀 수 있는 방법은 없나 고민을 하다가… 이미 바꿨는데 왜 또 대안을 찾나 싶어서 관뒀다. - 그리드 선택 기본값 False
Multiplt Bar Chart
1 |
|
- 들어오는 data는 melt 함수를 적용한 df다. melt 함수에서 var_name과 value_name을 지정해주고 그걸 y와 hue로 지정해줬는데,… 다른 방법을 사용하면 함수 재활용을 할 수 있을 것 같다. y와 hue를 column으로 불러준다느니 뭐나느니 하면서…
- sns.despine은 barplot이 뚜껑이 휭 하길래 넣어줬더니 뚜껑이 만들어졌다. 정확히 이해를 못하고 집어 쳐넣은 거라 아직도 이해를 못했다.
Display Values in Plot
ha와 va만 제대로 알고 있었어도 이렇게 개고생은 안 하는 건데 나는 바보 멍청이다.
시간을 오래 끌게 만든 내 무지함이 원망스러웠다.
1 |
|
- axis=0일 때, 즉 세로형 그래프일 때는 음수값이 하나도 없었으니까 버무리고 넘어갈 수 있었다.
- ax.patches로 막대기를 하나씩 끌어오고, 각 막대기가 갖고 있는 값을 p.get_sth()으로 가져온다. 가져올 수 있는 값은 4개로, left(x), bottom(y), width, height 이다.
- x은 그래프 최상단의 값을 정중앙에 놓기 위해 막대기의 절반 값을 만들어주고, y는 그 값을 막대기와 값 사이의 여백을 주어 가독성을 높이기 위해 설정 해주었다. value 설정을 안 해주고 그냥 height 값을 집어넣으면 float 타입으로 반환 된다. 내 기준에 소수점은 안 예뻐서 int 값으로 때려박았다.
- axis=1 == 가로형 그래프
- ha와 va의 용법이 문제였다!!!! 우ㅇ아아아
Pandas from_records & melt Function
데이터 재구조화
a, b값은 리스트
1 |
|
이것도 저 a[0]~ 이 부분을 어떻게 바꿀 수 있지 않을까 생각이 드는데 … ㅠㅠ 흠
https://rfriend.tistory.com/tag/Python%20pandas%20melt%28%29%20함수
이 블로그가 설명을 아주 기깔나게 잘 해주셔서 많이 참고했다.
Seaborn catplot
1 |
|
Col 별로 x, y 데이터를 보여줄 수 있다.
sns.catplot 내부에서 legend를 False 처리하고 바깥에서 matplotlib 으로 처리해줬다.
참고 : https://stackoverflow.com/questions/38807895/seaborn-multiple-barplots
Frequency Distribution
데이터가 csv 파일 형태로 있음을 가정
1 |
|
고찰
뭔가 더 좋은 방법이 있지 않을까 항상 고민을 하지만… 능력이 없어 고민으로 시간을 질질 끌다 결국 막을 내리기만 해 답답하기만 하다.
빈도수 차트는 왜 선이 꾸깃꾸깃하게 나올까 미치겠다…
다 하고 교수님 메일이 아니라 깃허브로 보냈고 교수님이 머지해 주시긴 하셨는데… 생각해보니 메일로 보냈어야 하나 싶다… ㅠㅠ아니 선이 왜 꾸깃꾸깃 하냐고 진짜 미치겠네