선형 회귀 및 는 어떤 차이가 로지스틱 회귀?

Question

Question

선형 회귀 및 는 어떤 차이가 로지스틱 회귀?

값을 예측할 때 우리는 [범주] (https://en.wikipedia.org/wiki/Categorical_variable) (또는 이산식) 우리가 사용하는 결과를 [로지스틱 회귀] (https://en.wikipedia.org/wiki/Logistic_regression). I believe 우리가 사용하는 [선형 회귀] (https://en.wikipedia.org/wiki/Linear_regression) 의 값을 예측할 수 있는 점을 고려할 때 입력 값을 결과물일 따름이다.

그런 다음 두 가지 방법을 차이가 뭘까?

nbro

편집된 질문25일 2월 2018 в 9:14

Solution / Answer

3일 6월 2018 в 1:53

바로 전날 추가 분입니다.

- 선형 회귀

인정해온 문제를 해결하기 위해 특정 요소에 출력 값을 추정하는 예측 / X (말하도다 f (x)). 긍정적인 결과를 예측할 수 있는 함수 또는 음의 값을 는 코티노우스 수 있습니다. 이 경우 일반적으로 입력 및 출력 값을 가지고 많은 데이터세트를 참조용이므로 각 그 희망이었네 목표는 이 데이터 세트 모델을 잘 할 수 있도록 새로운 요소를 다른 / 본 적이 있다고 보고 출력입니다 수 있다. 다음은 피팅이면 점 설정할 수 있지만, 일반적으로 고전적인 예로 선 선형 회귀 모델을 사용하여 높은 다항식 도) 보다 복잡한 맞게 사용할 수 있습니다.

! [입력하십시오. 이미지 여기에 설명을] [1]

문제 해결 *

두 가지 방법으로 해결할 수 회귀 중 하나이다.

보통 방정식입니다 (직접판매용 방식으로 문제를 해결하기 위해)
경사 하강법 (반복적인 외곽진입)

- 로지스틱 회귀

주어진 문제를 해결하기 위해 인정해온 분류 N 같은 분류 할 수 있는 요소를 범주입니다. 예를 들어 일반적인 예로는, 스팸 메일 분류할 수 있는 만큼 이를 방관하겠나 찾기를 느릅 나무 또는 주어진 차량 (자동차, 트럭, 부가가치통신망 (van), etc.) 이 범주에 속한다. # 39 의 유한 집합, s 는 기본적으로 that& 출력물에는 데크레티 값.

문제 해결 *

로지스틱 회귀 문제가 해결될 수 사용해서만 그래디언트 혈통이다. 일반적으로 선형 회귀 유일한 차이점은 현세생 작용한 매우 비슷하지만 서로 다른 가설이 있다. 선형 회귀 양식 있는 가설이 있다.

h(x) = theta_0 + theta_1*x_1 + theta_2*x_2 ..

여기서 우리는 맞춤, 세타 (θ) 는 모델을 시도하고 있다. [1, x_1, x_2.] 는 입력 벡터. 로지스틱 회귀 가설이 함수은 다르다.

g(x) = 1 / (1 + e^-x)

! [입력하십시오. 이미지 여기에 설명을] [2]

이 좋은 기능이 기본적으로 모든 가치를 위한 적절한 속성, it 매핑하므로 처리할 수 있는 범위 [0.1] 중 프로파바빌레티스 클라시피카틴. 예를 들어 이런 이진 분류에서 g (X) (positive class probability 속하는 것으로 해석될 수도 있다. 이 경우 일반적으로 서로 다른 클래스 있습니다 어떤 결정을 통해 분판된 않는비즈니스 분판의 결정하는 사이의 경계 조건이 커브를 등급이. 다음 예는 데이터세트를 분판된 두 개의 클래스가 있습니다.

! [입력하십시오. 이미지 여기에 설명을] [3]

rkachach

편집된 답변9일 7월 2018 в 8:06

10

0

Symphony

7일 7월 2018 в 6:34

| Basis                                                           | Linear                                                                         | Logistic                                                                                                            |
|-----------------------------------------------------------------|--------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------|
| Basic                                                           | The data is modelled using a straight line.                                    | The probability of some obtained event is represented as a linear function of a combination of predictor variables. |
| Linear relationship between dependent and independent variables | Is required                                                                    | Not required                                                                                                        |
| The independent variable                                        | Could be correlated with each other. (Specially in multiple linear regression) | Should not be correlated with each other (no multicollinearity exist).                                              |

1

0

질문 추가

카테고리

모두

기술

문화/레크리에이션

생활/예술

과학

직업

비즈니스

사용자

すべて

새로운

39 의 그냥 구미만 당긴다고 it& 사용할 수 있지만 충분히 it& # 39 의 선형 회귀 출력할 수 있기 때문에 실수를 할 수 없는 반면, 1 보다 큰 출력 확률 및 제외어 회귀 지정값이 실제로 있다.

충분히 생산할 수 있는 보다 큰 0 보다 작은, 심지어 1, 로지스틱 회귀 도입되었다.

출처: http://gerardnico.com/wiki/data_mining/simple_logistic_regression

! [입력하십시오. 이미지 여기에 설명을] [1] 그 -

선형 회귀 (종속 변수) 의 결과를) 가. 무수한 가능한 값 중 하나를 가질 수 있습니다.

로지스틱 회귀 (종속 변수) 만 있는, 결과에 대한 제한된 수의 가능한 값.

종속 변수 -

로지스틱 회귀 응답 특성을 가진 범주 가변입니다 경우에 사용됩니다. 예를 들어 yes / no, 참 / 거짓, 파랑, 녹색 / 적색 / 1st/2nd/3rd/4th, etc.

답글을 때 사용되는 선형 회귀 가변입니다 횡단면도. 예를 들어, 무게, 높이, 시간, etc.

방정식입니다 -

선형 회귀 원하는거요 방정식입니다 형태의 기울기는 Y = mX + C 함께 고말은 방정식입니다 도 1.

그러나 이는 기울기는 방정식입니다 형태의 로지스틱 회귀 Y = e&lt sup&gt X&lt /sup>;;; + e&lt X&lt /sup&gt sup> -;;;

- - 계수 해석

독립 변수는 계수 선형 회귀, 에 대한 해석은 매우 쉽습니다 (즉, 모두 갖고 다른 com/go/4e6b330a_kr 상수입니다 함께 유닛 증가 / 감소, 이 변수는 종속 변수 xxx 로 늘어날 것으로 보인다).

하지만 로지스틱 회귀 (맑음, 포아송 가족요 따라 달라집니다. 등) 와 링크 (log 를 로짓, 보색으로 로그에서는 등) 를 사용하는 다른 해석도 있다.

오류를 최소화 기법은 -

선형 회귀 ordinary squares 최소화하도록 이상 사용하는 방법 한 동안 도착하면 오류 및 최상의 선택인지 로지스틱 회귀 이 솔루션을 사용하는 방법을 maximum likelihood 도착할 예정이다.

선형 회귀 모델을 분류인 최소제곱 최소화할 수 있어 큰 오류는 오류가 데이터를 받는 정방형으로.

로지스틱 회귀 () 는 그 반대입니다. 로지스틱 함수를 사용하여 오류뿐만 받는 것으로 인해 큰 손실을 충족되었으며 점근 상수입니다.

이유를 알 수 있는 범주 {0, 1} 이 선형 회귀 결과를 고려해보십시오 문제가 있다. 결과는 예측 모델의 경우, 1, # 39 이것은 you& 때 38, ve 손실됩니다 아무것도아니야. # 39, 38, 로지스틱 wouldn& 줄일 수 있는 선형 회귀 시도할 것이라고 밝혔다. 2 t (많이) &lt &lt /sup&gt sup>;;).