#1에서 이어짐
안녕하세요, 스팀잇 뉴비 @islandvibes입니다. 데이터분석과정을 듣는 김에 스팀잇에 정리해보기로 했는데요,
첫번째, 박스플롯입니다.

수업을 듣기 시작했을 때 선생님이 그러셨습니다. 시각화는 사실 엑셀로도 가능하다! 중요한 건 데이터 수집 저장 정제(이게 젤 중요) 분석이다! 아니 일단 그래프나 그릴 수 있었으면 하는 심정에서는 무슨 말인가 했는데..
파일럿으로 서비스 내부 데이터로 한 번 돌려보니 제일 중요한 건 역시 데이터를 추리는 과정이더라구요. 문제(보고 싶은 것)을 선정해서 그게 잘 보이게끔 데이터를 잘 뽑고(SQL) 시각화를 해보면서 계속 수정하고 그 중에 의미있는 결론에 도달하는 것. 이게 전부.... 저는 서비스기획자로 사용자들이 어떻게 쓰는지 궁금했던 부분이 정확히 있어서, 처음 진도였던 boxplot으로 시각화라는 걸 해 봤습니다. 보고싶은 건 그거였어요. 사용자의 이상패턴을 혹시 눈으로 볼 수 있을까? 그럼 그걸 가지고 개선점을 도출할 수도 있지 않을까?
R의 기본문법으로 **summary()**를 돌려주면 짜잔하고 다음 값들이 나옵니다.
Min. 1st Qu. Median Mean 3rd Qu. Max.
최소값,1/4값, 중간값, 평균, 1/3값, 최대값
저는 이 정도로도 충분한 인사이트를 얻을 수 있지만 그래도 이것을 boxplot() 으로 돌려주면 아래와 같은 그림이 튀어나옵니다.

상태별로 다르게 뽑히는 예