728x90
반응형

분류 전체보기 96

적합 회귀선의 특징

· 적합된 반응변수(yhet)와 잔차 (e) 구하기 적합 반응변수의 값 yhet = b0 + b1 * xi 는 자료들이 회귀선에 적합할 때 설명변수의 값 xi에 대한 반응변수의 기댓값으로 yhet을 평균값 또는 x = xi 일때 반응변수의 기댓값이라고 한다. 이를 아래의 수식과 같이 표현할 수 있다. R에서 추정식과 잔차를 구한다면 다음과 같다. (오차는 모집단에서 추출했을 시, 잔차는 표본에서 추출했을 시 표현) 전에 예시로 사용했던 숙련기간에 따른 실패 횟수를 이용해서 예시를 든다. year = c(1, 9, 1, 4, 3, 3, 7, 9, 7, 6, 6, 1) # 숙련기간 fail = c(9, 1, 8 ,7, 6, 7, 6, 5, 5, 6, 7, 4) # 실패 reg = lm(fail ~ year)..

최소 제곱법 설명 및 증명(추정)

· 최소 제곱법의 증명(추정) 우선 최소 제곱법을 이해하기 위해서는 이차 편미분에 대한 개념을 알고 있어야 한다. 그리고 이를 이용해서 기울기와 절편을 유추하면 다음과 같은 결론을 내릴 수 있다. 절편의 공식을 유도하는 것은 1번 식과 2번 식을 잘 조합하면 유추할 수 있다. 기울기와 절편 모두 불편 추정량이다. 이에 관한 내용은 후에 다룰 것이다.

단순 회귀 모형 - 최소 제곱법(최소 자승법)

· 최소 제곱법(최소 자승법, Least Square) 만약 회귀 모형에서 직선의 식을 정의할 때 사람마다 정의하는 직선의 식이 다르다면 어떻게 될까? 아마 예측값을 제시할 때 자신의 식이 옳다고 주장할 것이다. 그렇기 때문에 이 직선의 식의 오류(오차)를 최소화하기 위해 만들어진 것이 최소 제곱법이다. 이해하기 쉽게 대강 그림으로 묘사하면 다음과 같다. 위에서 추정된 직선이 점차 잔차의 제곱합들이 최소가 되는 지점이 바로 실제 직선에 가까워진다는 개념이다. · 최소 제곱법에 근거하여 기울기 b1과 절편 b0 유추하기 위에서 설명했지만 최대한 실제 직선에 가깝게 유추하는 것이 가장 중요하다. 그렇기 때문에 최소 제곱법에 의한 기울기와 절편은 무엇보다도 중요하다고 할 수 있다. 최소 제곱법에 의하여 기울기..

단순 회귀 모형 - 회귀 직선의 추정식과 잔차(error)

· 회귀 직선의 추정 회귀 직선을 추정한다는 것은 전 장에서 다룬 직선의 식을 유추한다는 것이다. 이는 점추정, 구간추정의 두 가지 방법으로 표현할 수 있다. 설명변수와 반응변수 사이의 관계를 다음과 같이 쓸 수 있다. 직선식 추정으로 나온 추정값 yheti와 y는 약간의 차이가 존재하는 것이 일반적이며, 이를 잔차(Residual)라 한다.

단순 회귀 모형 - 개념

· 단순 회귀 모형 단순 회귀 모형은 연속성을 가지는 두 변수 x와 y가 쌍(Paired)을 이루는 형태를 가정하고 시작한다. 여기서 연속성이란, 범주형 데이터가 아닌 연속형 데이터를 의미한다. · 자료의 모양 (x1, y1), (x2, y2), (x3, y3), ..... , (xn, yn)의 모습을 하고 있다. x 데이터 집합과 y 데이터 집합 간의 상관관계가 있다고 판단되면 해당 직선 관계에 대해 요약할 수 있는 직선의 식을 찾을 수 있다. 영향을 주는 변수 x를 독립변수(설명변수), 영향을 받는 변수 y를 반응변수(종속변수)라고 한다. · 단순 선형 회귀 모형 두 변수 사이의 직선 관계는 다음의 식과 같이 표현할 수 있다. 모형 : yi = β1 * xi + β0 + εi (단, i = 1, 2,..

RStudio에서 R버전 업데이트 하기

· RStudio에서 R 버전 업데이트 RStudio에서는 R의 버전도 자동으로 설치까지 해주는 명령어가 존재한다. installr 이라는 패키지가 해당 기능을 담당하고 있다. 아래의 코드를 순서대로 입력하면 최신 버전의 R로 업데이트 할 수 있다. install.packages("installr") library(installr) check.for.updates.R() # R의 버전을 확인한다. install.R() # 최신 버전의 R을 설치한다. version # 현재 사용중인 컴퓨터의 플랫폼과 R의 버전 등이 나온다. 만약 check.for.updates.R() 명령어에서 최신 버전이면 아래와 같은 메세지 창이 나온다.

R - 기초

· R-Programing이란? R은 기존의 S 프로그램이라는 통계 프로그램을 그대로 이식하여 만든 통계 분석 프로그램이다. R의 가장 큰 매력적인 부분이라면 '무료'라는 것이다. 그렇기 때문에 아래 링크에서 무료로 다운 받아 사용할 수 있다. RStudio는 R을 사용하기데 있어 UI적인 편의성과 여러가지 부가기능을 제공하기 위해 만들어진 Tool이다. [R - 공식 홈페이지] - https://www.r-project.org/ [RStudio] - https://www.rstudio.com/products/rstudio/ RStudio Take control of your R code www.rstudio.com 툴 기능을 이용하여 R을 사용하면 수 많은 패키지를 다운 받아서 필요한 기능을 사용하고 ..

회귀 분석 - 단순 선형 회귀(상관계수r)

· 회귀분석 회귀분석이란 어떠한 데이터라도 분석 과정 및 결과에 따라 서로 연관이 없는 것처럼 보이거나 극적으로 큰 차이가 나서 관계가 없는 것처럼 보이더라도 데이터의 수가 많아지거나 시간의 지남에 따라 결국 원점(평균)으로 회귀(回歸, Regression) 한다는 의미이다. 그리고 이렇게 서로 관계를 갖는 데이터는 직선 상에서 서로 직선 관계를 갖게 된다.(음 또는 양의 직선 관계) 이렇게 직선 또는 간단한 곡선의 모양을 띄는 관계에서 찾아내고 해당 데이터의 수식을 유추하여 특정 조건의 기댓값과 예측값을 구하는 과정이다. 회귀분석은 일차 함수의 모양인 y = b1x + b0의 모양을 갖게 된다. 여기서 b1은 기울기, b0은 y의 절편을 뜻한다. x와 같이 아무런 영향을 받지 않지만 다른 변수에게 영향..

함수 내에서 변수의 생존 범위

· 함수 내 변수의 생존범위 변수는 작성하는 장소에 따라 생존하는 범위가 생기게 된다. 이는 변수의 참조 우선 순위와 관계가 있는데, 한정된 범위에서 사용되는 변수가 더 높은 우선 순위를 갖고 있다. 이해 하기 쉽게 표현하면 다음과 같다. 변수 참조의 우선 순위 : Local > Enclosing Function(함수 내) > Global(글로벌 변수) > Built-in(내장 변수) friend = '친구' # 전역 변수(작성중인 화면 내 모든 영역에서 사용 가능) def fun1(): name = '김시민' age = 26 friend = '이순신' # 지역 변수(Enclosing Function, 블럭 내에서만 유효) print(name, age, friend) fun1() # 결과에서 '친구'라는..

파이썬(Python) 2021.06.16
728x90
반응형