[Spotfire]통계 - Data Relationship

728x90

🔹 Spotfire의 Data Relationship 기능이란?

Spotfire의 Data Relationship 기능은 데이터 간의 상관관계를 분석하는 데 사용되며, 다양한 통계적 방법을 활용해 변수 간 연관성을 평가할 수 있다. Tool > Data relation에 들어가서 조절할 수 있다.

Y에 종속변수, X에 독립변수를 넣어 진행하면 결과를 바로 출력해준다.

다음과 같이 테이블과 차트 둘다 나오며, 테이블 젤 상위의 독립변수가 영향력이 가장 크다. (R square 값이 가장 크다.)

⚠️데이터셋은 반드시 Pivot된 형태여야 한다.

box plot 형태로 나오며, 마찬가지로 차트에서 p-value도 제공해주기에 가장 영향력이 변수도 바로 파악할 수 있다.

Pearson 상관분석	숫자 vs 숫자	두 변수 간 선형적 관계를 분석하는 기법. 상관계수(−1 ~ 1)를 계산하며, 1에 가까울수록 강한 양의 상관관계, -1에 가까울수록 강한 음의 상관관계를 의미함.	키(cm)와 몸무게(kg) 간의 관계 분석
Spearman 순위 상관분석	숫자 vs 숫자	두 변수의 순위(랭크) 기반 상관관계를 분석하는 기법. 비선형 관계도 파악 가능하며, 데이터가 정규성을 따르지 않아도 적용 가능.	공부시간(시간)과 시험점수(100점 만점)의 관계 분석
ANOVA (분산분석)	범주 vs 숫자	3개 이상의 그룹 간 평균 차이가 유의미한지 검정하는 기법. 데이터가 정규성을 따른다고 가정함. F-검정을 통해 그룹 간 평균 차이를 비교함.	운동 그룹(A, B, C)별 체중 감소량(kg) 차이 분석
Kruskal-Wallis 검정	범주 vs 숫자	ANOVA와 유사하지만, 비모수 검정으로 데이터가 정규성을 따르지 않아도 사용 가능. 3개 이상의 그룹 간 중앙값 차이가 유의미한지 검정하는 방법.	세 가지 학습법(A, B, C)에 따른 시험 점수 차이가 유의미한지 분석
Chi-Square (카이제곱 검정)	범주 vs 범주	두 개의 범주형 변수 간 독립성 검정을 수행. 기대 빈도와 실제 빈도의 차이를 분석하여 변수 간의 연관성을 파악함.	흡연 여부(Yes/No)와 운동 여부(Yes/No) 간 관계 분석

728x90

[Spotfire] Graphical Table (0)	2025.03.31
[Spotfire] Data handling - column 추가하기(calculated column, binned column, custom expression) (0)	2025.03.30
[Spotfire] Line chart, Bar chart, Pie chart (0)	2025.03.28
[Spotfire] Scatter plot 추세선, 기준선 (1)	2025.03.27
[Spotfire] Filter응용 - 시각화마다 다른 필터 적용 (0)	2025.03.26