신경망 - 페이지 4

 
joo писал(а) >> "선생님 없이 배우는 것"이 유일한 정답이라고 썼습니다.

전적으로. 네트워크에 완벽한 교사는 없기 때문입니다. 또는 오히려 우리는 네트워크에 이상적인 교사가 무엇인지 알 수 없습니다.....))))

 
LeoV >> :

전적으로. 네트워크에 완벽한 교사는 없기 때문입니다. 오히려 우리는 네트워크에 이상적인 교사가 무엇인지 알 수 없습니다.....))))

그게 다야! 교사를 사용하면 사인 곡선과 같이 이미 알려진 기능에 대해서만 그리드를 훈련할 수 있습니다. 여기서 우리는 양심의 가책 없이 다음과 같은 그물을 먹일 수 있습니다.

교사로서 가르칠 수 있는 점. 시장에서는 그러한 초점이 작동하지 않을 것입니다.

 
joo писал(а) >> 정확히! 교사를 사용하면 이미 알려진 함수(예: 사인파)에 대해서만 그리드를 훈련할 수 있습니다. 여기에서 우리는 양심의 가책 없이 교사로 훈련되는 지점에 따라 네트워크에 공급할 수 있습니다. 시장에서는 그러한 트릭이 작동하지 않을 것 입니다.

예, 이 변형에서는 훈련 세트의 오류가 작을수록 네트워크에 더 좋습니다. 그리고 시장에서는 그러한 속임수가 작동하지 않을 것 입니다.

 

지도 학습을 위해 엄격하게 네트워크를 구축하는 것은 바람직하지 않습니다. 모든 패턴을 코드로 수동으로 설명하는 것이 더 쉽고 오류가 적습니다.

신경망의 진정한 목적은 선생님 없이 배우는 것, 선생님이 모르는 것을 배우는 것,

당신이 개인적으로 볼 수 없는 패턴을 식별하는 것(아무도 볼 수 없는 것이 장점입니다).

PS 금발의 친구: "모른다"가 무슨 뜻인지 알잖아요.

여자친구: "모르겠어."

금발: 글쎄, 아무도 모른다.

 
LeoV >> :
gpwr write (a) >> 테스트 샘플의 오류가 더 이상 줄어들지 않을 때까지 네트워크를 훈련해야 한다는 내용이 어디에나 기록되어 있습니다.

사실 모든 것이 훨씬 더 복잡합니다. 테스트 샘플에서 최소 오차로 훈련하면 네트워크가 과도하게 훈련될 가능성이 큽니다.....

가능성은 없지만 그렇습니다. 진실. 게다가 더 나은 일반화를 위해 네트워크의 힘을 줄이는 것은 도움이 되지 않습니다. 테스트의 최소 오류는 앞으로의 실패입니다.
 
muallch писал(а) >>
가능성은 없지만 그렇습니다. 진실. 게다가 더 나은 일반화를 위해 네트워크의 힘을 줄이는 것은 도움이 되지 않습니다. 테스트의 최소 오류는 앞으로의 실패입니다.

동의한다. 나는 오버트레이닝의 명확성의 의미에서 "가장 가능성이 있는"이라는 표현을 사용했습니다 .....)))) 그리고 네트워크의 힘을 줄이는 것은 때때로 여전히 도움이 됩니다 ......

 
muallch >> :
가능성은 없지만 그렇습니다. 진실. 게다가 더 나은 일반화를 위해 네트워크의 힘을 줄이는 것은 도움이 되지 않습니다. 테스트의 최소 오류는 앞으로의 실패입니다.

시민 여러분, 더 현명한 것입니다. 그들이 새로운 것을 발명했거나 우리는 서로를 이해하지 못합니다.

모든 교과서에는 교사와의 네트워크 훈련이 데이터를 훈련 샘플과 테스트 샘플로 분할하여 발생한다고 쓰여 있습니다. 네트워크는 훈련 샘플의 오류를 최소화하여 훈련되는 반면 테스트 샘플에서 오류가 관찰됩니다(표본 외 테스트 또는 검증). 테스트 세트의 오류 감소가 중지되면 훈련이 중지됩니다(하단에 점선으로 표시됨). 또한 훈련 샘플의 오류는 이 그림과 같이 계속 감소할 수 있습니다.


당신은 그림에서 점선으로 표시된 것보다 더 일찍 네트워크 훈련을 중단해야 한다고 주장합니다. 정확히 어디에? 그렇다면 왜 네트워크를 훈련해야 할까요? 당신의 논리에 따라 가중치의 값을 선택하고 네트워크를 사용하여 거래하십시오. 그 때 당신은 진정한 배수구를 갖게 될 것입니다.

 
LeoV >> :

동의한다. 나는 오버트레이닝의 명확성의 의미에서 "가장 가능성이 있는"이라는 표현을 사용했습니다 .....)))) 그리고 네트워크의 힘을 줄이는 것은 때때로 여전히 도움이 됩니다 ......

정확히. 문제의 사실은 때때로 ... Mashki의 Grails가 때때로 포워드에게 이익을 주기도 합니다. 훈련된 그리드의 힘(레이어링, 뉴런 ... 등)에 대한 순방향 결과의 명확한 체계적 의존성은 없습니다(적어도 찾지 못했습니다). 그리드 유형에 따라 달라지는 것이 없다는 말은 아닙니다. 이는 기준 중 하나일 뿐입니다. 그러나 테스트 샘플 외부의 이익 크기는 학습 정도에 대한 명확한 의존성(비선형)을 가지고 있습니다. "종단 간" 테스트를 통한 수많은 실험이 이를 확인합니다.

 
gpwr >> :

당신은 그림에서 점선으로 표시된 것보다 더 일찍 네트워크 훈련을 중단해야 한다고 주장합니다. 정확히 어디에? 그렇다면 왜 네트워크를 훈련해야 할까요? 당신의 논리에 따라 가중치의 값을 선택하고 네트워크를 사용하여 거래하십시오. 그 때 당신은 진정한 배수구를 갖게 될 것입니다.

아니요, 승인하지 않습니다.


그리고 그것에 대해 논쟁하는 것은 어렵습니다 ...

 
gpwr >> :

시민 여러분, 더 현명한 것입니다. 그들이 새로운 것을 발명했거나 우리는 서로를 이해하지 못합니다.

모든 교과서에는 교사와의 네트워크 훈련이 데이터를 훈련 샘플과 테스트 샘플로 분할하여 발생한다고 쓰여 있습니다. 네트워크는 훈련 샘플의 오류를 최소화하여 훈련되는 반면 테스트 샘플에서 오류가 관찰됩니다(표본 외 테스트 또는 검증). 테스트 세트의 오류 감소가 중지되면 훈련이 중지됩니다(하단에 점선으로 표시됨). 또한 훈련 샘플의 오류는 이 그림과 같이 계속 감소할 수 있습니다.

먼저 그리드를 설정하기 위한 out-of-sample이 있습니다. 그러면 그렇지 않을 것입니다. 진정한 미래는 눈앞에 있으며 예측해야 합니다. 훈련을 중단하는 기준은 무엇입니까 - 특정 오류 또는 훈련 실행 횟수? 또는 다른 것?

사유: