
1. 통계적 추론 1.1 가설검정의 용어통계적 추론에서는 (1) 모수의 추정 혹은 (2) 모수에 대한 가설 검정 이라는 2가지 문제로 나누어 전개 * 추정- 점 추정 : 모수를 특정한 수치로 표현하는 것 남성의 평균 키는 170cm이다.- 구간 추정 : 추정 값에 대한 신뢰도를 제시하면서 모수를 추정하는 방법남성의 평균키는 0 ~ 200 이다: 정답이지만 명확하지 않음남성의 평균키는 163부터 177에 있을 확률이 95%이다 → 구체적인 정보를 줌- 신뢰 구간 : 모수가 포함될 것이라고 예상되는 구간. 전체 데이ㅓ가 95%가 들어오는 구간을 많이 사용한다 * 가설검정정의 : 모집단의 특징에 대한 가설을 세우고 표본에서 얻는 정보를 통해 옳은지 판정하는 과정귀무가설 : 현재 믿어지고 있는 가설, 실험과 ..

정규분포 1.1 용어 정리모집단 Population : 궁극적으로 관심 있는 집단. 모집단의 특징을 모수(parameter)라 함표본집단 Sample : 모집단에서 특정한 방법을 이용하여 뽑아낸 임의의 집단. 특징들을 통계량(Statistic)이라 함 1.2 표본 추출의 중요성샘플링 편항(Sampling bias) : 분석 대상이 표본을 선택할 때 과대하게 대표 되거나 반대의 경우ex) 1936 미국 대선 당시 민주당 루즈벨트 vs 공화당 랜던의 경선 (자동차, 전화기 부유층의 상징) 이처럼 편향을 없애기 위한 다양한 표본추출 방법이 있다. 참고 : https://brunch.co.kr/@hjkim0892/204 2. 정규 분포의 중요성데이터 분석에 대한 피라미드 통계학의 대표적인 방법론은 기술통계와 ..

1. 데이터 분석이 중요해진 이유 현재의 저장기술의 하락, 빅데이터 처리 기술의 발전 등으로 모집단에 준하는 빅데이터를 보유할 수 있게 되어서 - 데이터 분석으로 할 수 있는 일들 기술 통계 / 시각화 : 데이터를 명확히 보기. 집계하고 보여주는 것에 관심이 있으며 논쟁의 여지가 다소 적음추론통계 : 내가 가진 데이터를 보고 실제 데이터를 예측, 추정하는 것(얼마나 그럴까). 그 사실이 맞나 확인하기 데이터 표본을 통해서 모집단의 특성을 추정하는 방법머신러닝/딥러닝 : 정확히 얼마일지 예측하는 것. 알고리즘에 기대에 결과를 예측하거나 새로운 정보 도출하기 * 현재 데이터분석의 환경- 데이터 성숙도에 따른 직군의 변화 초기 : 데이터 분석가가 모든 역할을 수행중기 : 데이터 사..