👨‍💻
Hamin TIL
  • Today I Learned 🧑🏻‍💻
  • 회고
  • git
    • git_basics
      • Git 101
      • Git branch
      • Git_ignore
    • Git Book
    • 우아한형제들
    • pull_request
  • db
    • DA
      • 데이터표준화
      • 데이터_요건분석
      • 전사아키텍처_이해
      • 데이터모델링
    • SQL
      • SQL기본및활용
        • SQL활용
          • 절차형SQL
          • 계층형질의와셀프조인
          • DCL
          • 그룹함수
          • 윈도우함수
          • 표준조인
          • 집합연산자
          • 서브쿼리
        • SQL고급활용및튜닝
          • 옵티마이저와실행계획
          • 조인수행원리
          • 인덱스기본
        • SQL기본
          • 함수
          • 관계형데이터베이스개요
          • GROUPBY,HAVING절
          • DDL
          • 조인
          • ORDERBY절
          • DML
          • WHERE절
          • TCL
      • 데이터모델링의이해
        • 데이터모델과성능
          • 정규화의 성능
          • 데이터베이스구조와성능
          • 분산데이터베이스와성능
          • 대량 데이터에 따른 성능
          • 반정규화와 성능
          • 성능데이터모델링의 개요
        • 데이터모델링의이해
          • 식별자
          • 속성
          • 관계
          • 엔터티
          • 데이터 모델의 이해
    • DB
  • trouble
    • libomp
    • After macOS update, git command
    • system
  • algorithm
    • BOJ
      • 평범한 배낭
      • 17825-주사위윷놀이
      • 14888-연산자끼워넣기
      • 14503-로봇청소기
      • 10157
      • 14502-연구소
      • 18428-감시피하기
      • 14501
      • 18405-경쟁적전염
      • 14499-주사위굴리기
      • 16236-아기상어
      • 15686-치킨배달
      • 19237-어른상어
      • 16234-인구이동
      • 19236-청소년상어
      • 1339-단어수학
      • 리모콘
      • 18353 - 병사배치하기
      • 18352-특정거리의도시찾기
      • 12100-2048
      • N-Queen
      • 3190-뱀
      • 11724
    • programmers
      • 영어끝말잇기
      • 기둥과 보
      • H - index
      • 정수삼각형
      • 2018 KAKAO BLIND RECRUITMENT - 압축
      • 삼각달팽이
      • 거스름돈
      • [1차] 셔틀버스
    • data_structure
      • Queue
      • Graph
      • Stack
      • Hash table
    • implementation
      • dynamic_programming
      • sort
      • Least common multiple
      • dfs
      • dijkstra
      • bfs
      • binary_search
    • aps
      • notes
    • modules
  • python
    • requirements.txt
    • Jupyter notebook
    • 00_들어가기 전에
    • Python Virtual Environment
    • Python Syntax
  • django
    • Class Based View in Django
    • Model in Django
    • URL Name
    • Form and ModelForm
    • Authentication
    • Tips & Tricks
    • Optimization
    • Request and Response Objects
    • Templates
    • Variable Routing & DTL
    • Django REST API with JSON web token (JWT)
    • Intro to Django
    • Django REST Framework
    • Wrap-up
    • Image Upload
  • javascript
    • Ajax (Asynchronous Javascript And XML)
    • Document Object Model
    • Java Script 101
    • ES (ECMAscript)
  • java
    • Java 101
  • aws
    • beginning_cloud_computing_with_aws
      • 02 AWS 주요 서비스 이해하기
      • 01 아마존 웹 서비스 Cloud 개요
  • programming
    • Communication
    • CS_용어사전
  • vue.js
    • 01_Vue.js_Intro
  • data_science
    • 01_데이터에서인사이트발견하기
    • pandas
    • 04_데이터분류모델
    • 02_텍스트마이닝첫걸음
    • 05_종합예제
    • 03_미래를예측하는데이터분석
    • Statistics
      • 모수와 추정량
    • 통계학노트
  • linux
    • Linux Commands
  • ide
    • VScode
    • Pycharm
  • html,css
    • HTML 101
    • CSS 101
  • colab
    • colab_101
  • 의사결정나무및모형비교
Powered by GitBook
On this page
  • 통계학 노트
  • t-test
  • 검정 통계량 (test statistic)
  • t-value
  • F-value
  • P-value
  • 그러나

Was this helpful?

  1. data_science

통계학노트

Previous모수와 추정량Nextlinux

Last updated 4 years ago

Was this helpful?

통계학 노트

데이터사이언스를 하다보니 모르는 통계학 용어가 많이 나와서 공부할때마다 간단하게 메모해놓음

t-test

두 집단 간 평균의 차이가 유의미한지 검증하는 가장 보편적인 방법 실제 정보를 모를 때, 현재의 데이터만으로 두 집단의 차이에 대해 검정할 수 있는 방법 두 데이터는 개수가 비슷하면서 두 데이터가 정규분포를 이룰 때 신뢰도가 높다.

t-test 의 귀무가설은 " 두 집단의 평균이 같다."

c.f.

  • 해석방법

    • 검정 통계량 (t-statistic) 은 p-value (귀무 가설이 맞다는 전제하에 현재 나온 통계값 이상이 나올 확률) 와 함께 관찰해야 하는데, 보통 P-value 가 0.05 나 0.01 보다 작을 때 채택한다.

  • method

    • test_ind()

      • Equal_var = True: 두 집단의 분산이 같은 경우

      • Equal_var = False: 두 집단의 분산이 같지 않은 경우

  • 결론

    • 대립가설은 "두 집단의 평균이 다르다" 인데, 이는 통계적 분석을 하기에 좋은 조건에서 유의미하다고 할 수 있다.

    • 통계적 조건이 좋은 조건에서 t-test 와 같은 방법을 사용할 수 있다.

검정 통계량 (test statistic)

표본 통계량을 2차 가공한 것. 값이 기준을 벗어나는지 확인

t-value

차이를 불확실도로 나눈 것

"차이는 이 정도나면서 불확실도는 이 정도다" 를 의미함

두 표본 간 어떠한 통계값을 비교 시 사용

F-value

여러 그룹 간 차이

t-value 와 비교해 분산을 사용함으로써 두 그룹이 아닌 여러 그룹 간 차이를 알 수 있음

P-value

검정 통계량보다 크거나 같은 값이 나올 확률

"두 표본 집단이 같은 모집단이라고 치자(귀무가설) 그랬을 때, 우리가 이런 검정 통계량을 얻었는데, 이게 얼마나 말이 되냐?"에 대한 지표

이는 검정 통계량을 표본 수에 따라 정규화하여 확률 단위로 나타내며 (보통) 5% 이하일 때 유의미하다고 한다.

그러나

표본 수 (n) 이나 effect size 에 따라 p-value 는 변할 수 있으니 주의해야 하며, 특히 요즘처럼 n 이 큰 정보를 다루니 더욱 조심

블로그