본문 바로가기

Dev/데이터 분석11

[데이터분석] 공유 자전거 데이터 분석(2편) 안녕하세요! 코크리 크리에이터 김보경입니다🙋🏻‍♀️ 모두가 할 수 있는 데이터분석 2편입니다! 지난 컨텐츠에서는 데이터의 구조와 명세에 대해서 간단하게 알아보고, 그래프를 그려 전체적인 분포와 수치를 해석하는 시간을 통해 boxplot에서는 정규분포를 따르는 것 처럼 보이지만 히스토그램을 그려서 쌍봉분포를 취하고 있다는 것을 확인했습니다. 이번편에서는 1편에서 다 파악하지 못한 데이터를 조금 더 탐색해보는 시간을 가지려고 합니다. EDA(Exploratory Data Analysis, 탐색적 데이터 분석) EDA란 데이터의 특징과 내재하는 구조적 관계를 알아내기 위해 시각화나 통계적 방법을 통해 다양한 각도에서 관찰하고 이해하는 과정을 말합니다. EDA 또한 정답이 없는 것이다보니 어떻게 시작할지 막막하.. 2022. 8. 31.
[데이터분석] 공유 자전거 데이터 분석(1편) 안녕하세요! 코크리 크리에이터 김보경입니다🙋🏻‍♀️ 드디어 기다리고 기다리셨던 모두가 할 수 있는 데이터분석 1편입니다! 어떤 콘텐츠인가요? 해당 콘텐츠는 데이터 분석시 EDA를 하면서 그리는 그래프에 대한 정의와 해당 그래프가 의미하는 바는 무엇인지에 대한 기초적인 내용이 포함되어있습니다. 저도 가장 처음에 데이터를 다룰때 그래프를 이해하려고 했던 방식 그대로 해당 수치가 어떤걸 의미하는지, 그래프에서 어떤 인사이트를 발견하는지에 대해 공유하고자 합니다. 왜 공유 자전거 데이터셋인가요? 평소에도 이동과 관련하여 관심을 갖고 있었고 최근 배달산업으로 이직을 하면서 라이더나 배달 관련 데이터로 분석을 하려했습니다만, 괜찮아 보이는 데이터를 발견했는데 아쉽게도 데이터셋이 비공개 되어있어서 해당 산업에 대한 .. 2022. 6. 30.
[데이터분석] 데이터 분석가는 어떤 일을 하나요? [출처] 모두의 연구소에서 진행하는 "함께 콘텐츠를 제작하는 콘텐츠 크리에이터 모임" COCRE(코크리) 1기 회원으로 제작한 글입니다. 👉🏻 코크리가 궁금하다면? 👈🏻 목차 - 들어가며 - 데이터 분석가, 데이터 엔지니어, 데이터 사이언티스트는 다른건가요? - 데이터 분석가는 어떤 일을 하나요? - 데이터 분석가는 어떤 역량을 갖춰야 하나요? 들어가며 인터넷이 널리 보급되고 한참 뒤 알파고의 등장과 함께 4차 산업혁명이라는 단어가 급부상했습니다. 그중 가장 화제였던 인공지능과 빅데이터의 중요성이 날이 갈수록 커지면서 머신러닝, 딥러닝, 데이터 관련 직군이 인기를 끌기 시작했습니다. 과거에도 데이터 관련된 직군으로 통계전문가, 비즈니스 전문가 등이 있었습니다. 과거에 비해 갈수록 데이터 저장 및 처리할 .. 2021. 12. 17.
[가설검정] P-value란?(어떤 사건이 우연히 발생할 확률) 통계의 기본 P-value 편! 통계를 공부하다보면 P-value에 따라 이 값은 유의하다, 유의하지 않다를 판단하는데 도대체 P-value가 무엇일까요? [이미지 링크] 어떤 사건이 우연히 발생할 확률이 얼마일까? 우선 P-value를 어느곳에 적용하는지 알기위해서 가설검정에 대한 이해가 선행되어야 합니다. 목차 더보기 가설검정 H0 : 귀무가설(Null Hypothesis) : 반증의 대상 H1 : 대립가설(Alternative Hypothesis) : 연구의 대상 P-value란? 그래서 P-value를 어디에 사용하나요? 제 1종 오류 : 귀무가설이 참(true)임에도 불구하고 귀무가설을 기각할 때 발생하는 오류 제 2종 오류 : 귀무가설이 거짓(false)임에도 불구하고 귀무가설을 채택하는 오류.. 2021. 12. 17.
[시각화] 주어진 데이터로 적합한 시각화하기 데이터 분석가로 일을 하다보니, 데이터 추출 및 가공을 통해 수치를 뽑아낸 후 다른사람에게 보여주며 이해를 시키는 것이 중요한 부분이라는 것을 매번 느끼고있다. 비즈니스 문제를 해결하거나, 데이터의 패턴을 파악하고자할 때 어떻게 시각화를 할까 매번 고민하는데 해결하려는 문제 유형에 따라 차트의 기본 설정을 좁힐 수 있는 5가지 방법을 소개하려한다. 보고서를 만들때나 대시보드를 제작할 때 목적에 맞게 시각화를 하는 방법은 무엇일까 1. 값을 비교하려는 경우 차트는 데이터셋에서 하나 이상의 값을 비교하는 데 가장 적합하다. 여러달에 걸쳐서, 각 segment에서 제품의 성능을 비교 키, 몸무게 등 비교를 위한 차트로는 다음 유형의 그래프를 사용할 수 있다. 막대 그래프(Bar Chart), 파이차트(Pie .. 2021. 11. 20.
반응형