데이터사이언스8 [데이터사이언스] 통계분석 통계분석 위치&변이 통계량 위치통계량(중심 경향성) 1.산술평균(mean):각 자료에 대해 유일한 값, 극단적인 값에 민감 기대값: 평균이 수치형 데이터에 대한 대표값이라면, 기대값은 모르는 데이터에 대한 평균값 2.중앙값(median):가운데있는 값, 중앙값을 중심으로 확률분포의 두 면적이 같음 3.최빈값(mode):빈도가 가장 많은 값, 존재하지 않을수 있고, 유일한 값이 아닐수도 있음 변이통계량(퍼짐 정도) 1.범위:최대치와 최소치의 차이 2.중간범위:범위/2 3.평균절대편차(Mean Absolute Deviation): 편차(평균과의 차이), 편차의 합은 0 4.분산: "표본"분산의 분모는 (n-1)로 나눠줘야 함 -> 자유도(degree of freedom) 편차제곱합의 편균(분모가 n)을 구하.. 2023. 3. 27. [데이터사이언스] 자료의 이해: 기본용어 / 시각화 자료의 이해: 기본용어 모집단(Population): 현재 우리가 수집한 모든 데이타 Set 모수(Parameters): 모집단을 분석해서 얻어지는 수치 표본(Sample): 전체 모집단을 다 볼수 없기때문에 데이터를 추출한 값 통계량(Statistics): 표본을 분석하여 얻어지는 결과 수치 표본에서 얻어지는 통계량을 가지고, 모집단의 모수를 추론(추정)한다 모수는 그리스문자, 통계량은 알파벳으로 표기 개체(item): 관심대상 요인(Factor): 요인을 묶은 상위개념 변수:개체(item)을 구성하고 있는 요소, Column 데이터 관측치(Observation):행정보 범주형데이터: 문자, 당연히 연산 불가 -> 빈도 기반 연산 연속형데이터: 숫자 열(Column) 정보: feature(특성), at.. 2023. 3. 26. 이전 1 2 다음