본문 바로가기

인과분석4

데이터 분석가라면 필수! 상관관계 인과관계 특징과 예시 안녕하세요. 최근 네이버 블로그만 하느라 오랜만에 데이터 분석 관련 포스팅을 써보네요! 데이터 분석가라면 필수로 알고 있어야하는 상관관계와 인과관계에 대한 특징에 대한 설명과 예시들을 설명 드리려고 합니다 :)  상관관계 vs 인과관계상관관계(Correlation)의미 : 두 변수 간의 연관성 또는 패턴이 관찰되는 상태. 한 변수의 변화에 따라 다른 변수도 변화하는 경향이 있을때 이를 상관관계라고 함.특징상관관계는 인과관계를 나타내지 않을 수 있음상관계수(Pearson's r)는 -1에서 1 사이의 값을 가지며, 값이 클수록 두 변수의 연관성이 강함을 의미양의 상관관계(r>0) : 한 변수가 증가하면 다른 변수도 증가)음의 상관관계(r상관관계 없음(r=0)예시(배달 데이터)배달 데이터를 분석하다보면 특정.. 2024. 12. 9.
[분석] 인과추론(3) - 행동 데이터 분석 들어가며 지난 콘텐츠에서는 조금 더 상세한 행동 데이터 분석에 대해서 알아봤습니다. 이번 편에서는 데이터를 기반으로 포함할 관찰 가능한 변수 검증 및 인과관계 다이어그램을 단순화 해보려고 합니다. >> 2편 자세히 보러가기 2024. 3. 7.
[분석] 인과추론(2) - 행동 데이터 분석 들어가며 지난 콘텐츠에서는 분석의 종류, 분석시 주의해야할 점, 행동 데이터 분석이란?, 인과관계 다이어그램에 대해서 알아봤습니다. 이번 편에서는 조금 더 상세한 행동 데이터 분석에 대해 알아보겠습니다. >> 1편 자세히 보러가기 2024. 2. 28.
[분석] 인과추론(1) - 행동 데이터 분석 들어가며 데이터분석가로 실무를 경험하는 입장에서 데이터를 통해 항상 풀리지 않는 부분이 있습니다. "사람들은 왜 이렇게 행동한 것일까.", "사람들은 주로 어떻게 행동하는가." 등. 데이터 분석가의 입장에서 "왜" 라는 것을 데이터를 통해 찾아봐도 알 수 없는 부분이 존재합니다. 그것이 바로 도메인 지식이 필요한 이유이고, 그 도메인 지식 안에 교란변수가 어떤것이 있고 시즈널적인 요소는 어떤 부분에서 존재하는지 등을 알 수 있게 되는 것 같습니다. 그래서 지난 콘텐츠에서 다뤘던 THICK data(씩 데이터) 에서도 나타나는 것 처럼 총제적 시야가 필요합니다. 총체적 시야는 결국 ‘관계를 파악하고 연결하는 능력’이다. 분석의 종류 분석에는 기술분석, 예측, 인과관계라는 세 가지 유형이 있습니다. 기술분석.. 2024. 2. 23.
반응형