나는 GMM에 대한 작은 샘플을 수락한다는 아이디어를 확장하려고했습니다. 6개월 훈련, 5년 시험. 레이블은 고정 크기의 n 부분으로 나뉩니다. 각 부품에 대해 고유한 GMM 모델을 만들고 각각에서 1000개의 샘플을 생성하고 더미에 넣고 컷버스를 훈련했습니다. 나는 기능을 집어 들었고 다음과 같이 밝혀졌습니다.
나는 GMM에 대한 작은 샘플을 수락한다는 아이디어를 확장하려고했습니다. 6개월 훈련, 5년 시험. 레이블은 고정 크기의 n 부분으로 나뉩니다. 각 부품에 대해 고유한 GMM 모델을 만들고 각각에서 1000개의 샘플을 생성하고 더미에 넣고 컷버스를 훈련했습니다. 나는 기능을 집어 들었고 다음과 같이 밝혀졌습니다.
두 번째 옵션, 동일한 레이블, 동일한 파티션이 있지만 사전 혼합:
두 경우 모두 하나의 고정 대상이 사용되었습니다. 원한다면 이 실험을 재현할 수 있습니다. 나는 그러한 현상을 해석하는 데 강하지 않습니다. 아마도 설명이있을 것입니다.
흠 전인가 부스트 전인가? 기차/시험을 위한 클래스 밸런스 확인이 필요합니다. 아마도 0은 기차에, 1은 테스트에 들어갈 수 있습니다. 레이블을 구매 및 판매하여 별도의 클러스터링을 시도할 수도 있습니다.
Сбербанк запустил сервис, в котором диагноз по описанным пациентами симптомам будет ставить искусственный интеллект. Цифровая медицина — перспективное направление, но эксперты пока видят очень много рисков в «лечении» нейросетями Входящие в группу Сбербанка компании — «СберЗдоровье», «СберМед ИИ» и «Лаборатория по искусственному интеллекту» —...
이 경우 115개의 레이블을 섞어서 4부분으로 나누었습니다. 이후 이를 기반으로 4개의 GMM 모델을 만들었다. 각 샘플에서 1000개의 레이블이 샘플링되어 하나의 데이터 프레임으로 결합됩니다. 그 후, 기차와 테스트로 반으로 나뉩니다.
샘플 클래스의 균형은 이상과 약간 다릅니다. 그러나 기차와 테스트 샘플에서는 거의 동일한 비율이 나타났습니다.
다음은 115개 레이블의 동일한 샘플을 4개 부분으로 나누어 셔플링하지 않은 시뮬레이션 결과입니다. 물론 수업의 균형은 조금 나아지지만 이것이 결과에 큰 영향을 미치지 않는 것 같습니다.
아마도 어리석게 들릴지 모르지만 시리즈에는 GMM 모델이 시리즈의 다른 부분에서 찾을 수 있는 일종의 관계가 있는 것 같습니다. 행을 섞어서 순서를 어지럽히면 사라집니다.
따로 클러스터링은 생각 못했는데 저녁에 해봐야겠습니다.
그려야 해서 불명확 .. 뭐, 두 경우 모두 분포가 다르다는 것은 사실입니다. 또한 이미 직렬화를 제거했습니다. 대부분의 경우 분포는 매우 유익하지 않은 것으로 판명되었으며 샘플링 후 새로운 포인트는 이해할 수 없는 위치에 놓이기 시작합니다. 저것들. 연속된 정보가 손실됩니다. 예, 따옴표는 독립적이지 않습니다.
그려야 해서 불명확 .. 뭐, 두 경우 모두 분포가 다르다는 것은 사실입니다. 또한 직렬화를 이미 제거했습니다. 대부분의 경우 분포는 매우 유익하지 않은 것으로 판명되었으며 샘플링 후 새로운 포인트는 이해할 수 없는 위치에 놓이기 시작합니다. 저것들. 연속된 정보가 손실됩니다. 따옴표는 독립적이지 않습니다.
또는 따옴표가 아닌 간단한 예에서 수행하고 나중에 비교하십시오.
맥심, 안녕하세요. 나는 여기에 오랫동안 있지 않았습니다 ... 당신의 마지막 기사에 대해) 나는 결국 파이썬을 넣었습니다) 나는 그것을 알아 내려고 노력하고 있으며 많은 질문이 있습니다))) MARKUP은 이것이 내가 이해하는 방식입니다 확산? 현재 값을 현재 값 + 임의의 숫자와 비교하여 레이블을 배치합니다. > 또는 < 기호에 따라 레이블 1 또는 0을 넣습니다. 맞습니까? 테스트를 위해 markup=0.0을 설정합니까? 기차와 함께 MARKUP=0,00001 like))) 맞죠?
맥심, 안녕하세요. 나는 여기에 오랫동안 있지 않았습니다 ... 당신의 마지막 기사에 대해) 나는 결국 파이썬을 넣었습니다) 나는 그것을 알아 내려고 노력하고 있으며 많은 질문이 있습니다))) MARKUP은 이것이 내가 이해하는 방식입니다 확산? 현재 값을 현재 값 + 임의의 숫자와 비교하여 레이블을 배치합니다. > 또는 < 기호에 따라 레이블 1 또는 0을 넣습니다. 맞습니까? 테스트를 위해 markup=0.0을 설정합니까? 기차와 함께 MARKUP=0,00001 like))) 맞죠?
안녕하세요. 네, 맞습니다. 테스터에서는 동일한 마크업이 사용됩니다. 기사의 기사에 대해 묻는 것이 더 나을 것입니다. 한 곳에 있기 위해
그는 바닥 .ktrl .. 교육에 대한 위키 링크를 제공했습니다. 내가 이해한 표시는 안정적인 영역의 가장자리입니다.
ZZ는 작동하지 않습니다. 마크업이 섹션의 차이 없이 진행되고 훈련도 같은 방식으로 진행되기 때문입니다. ZZ 마크에 따르면 이는 다른 기능을 가진 너무 많은 예제와 같으며 훈련 결과는 잘해.
레이블은 알려진 target\classes입니다. 그것들이 없는 나머지 데이터는 기능의 형태로만 존재합니다.
이 레이블에는 어떤 의미가 있습니다. 예를 들어 고양이 또는 악어라는 라벨
우리의 경우 고양이가 어디에 있는지 전혀 모릅니다. 저것들. 패턴과 차이점을 모르기 때문에 작업이 더욱 복잡해집니다.
따라서 레이블의 초기 마크업은 강제적일 수 있으며 옵션을 반복합니다.
그것은 단지 알려진 target\classes입니다. 그것들이 없는 다른 데이터
올바른 검색 방향을 설정하는 방법입니다.)))
이 레이블에는 어떤 의미가 있습니다. 예를 들어 고양이 또는 악어라는 라벨
우리의 경우 고양이가 어디에 있는지 전혀 모릅니다. 저것들. 패턴과 차이점을 모르기 때문에 작업이 더욱 복잡해집니다.
따라서 레이블의 초기 마크업은 강제적일 수 있으며 옵션을 반복합니다.
완전한 열거는 불완전한 열거보다 항상 낫습니다. 불완전하게 올바른 마크업에는 항상 의미가 있습니다. 그리고 차원의 저주는 탐색의 올바른 방향에 의해서만 해결됩니다. 옵션을 분류하기에 좋은 사이트를 찾거나 결정하는 문제.
나는 GMM에 대한 작은 샘플을 수락한다는 아이디어를 확장하려고했습니다. 6개월 훈련, 5년 시험. 레이블은 고정 크기의 n 부분으로 나뉩니다. 각 부품에 대해 고유한 GMM 모델을 만들고 각각에서 1000개의 샘플을 생성하고 더미에 넣고 컷버스를 훈련했습니다. 나는 기능을 집어 들었고 다음과 같이 밝혀졌습니다.
두 번째 옵션, 동일한 레이블, 동일한 파티션이 있지만 사전 혼합:
X = X.sample(frac= 1.0 )
두 경우 모두 하나의 고정 대상이 사용되었습니다. 원한다면 이 실험을 재현할 수 있습니다. 나는 그러한 현상을 해석하는 데 강하지 않으며 아마도 설명이있을 것입니다.
나는 GMM에 대한 작은 샘플을 수락한다는 아이디어를 확장하려고했습니다. 6개월 훈련, 5년 시험. 레이블은 고정 크기의 n 부분으로 나뉩니다. 각 부품에 대해 고유한 GMM 모델을 만들고 각각에서 1000개의 샘플을 생성하고 더미에 넣고 컷버스를 훈련했습니다. 나는 기능을 집어 들었고 다음과 같이 밝혀졌습니다.
두 번째 옵션, 동일한 레이블, 동일한 파티션이 있지만 사전 혼합:
두 경우 모두 하나의 고정 대상이 사용되었습니다. 원한다면 이 실험을 재현할 수 있습니다. 나는 그러한 현상을 해석하는 데 강하지 않습니다. 아마도 설명이있을 것입니다.
죄송합니다 여러분, 질문이 있습니다.
그리드에 얼마나 많은 가중치가 있고 얼마나 많은 거래가 훈련되어 있습니까?
나는 이 숫자들 사이의 관계를 이해하고 이 관계에 대한 재훈련 가능성의 의존성에 대해 생각하고 싶습니다. 고맙습니다.
흠, 부스트 전에 믹싱하고 있습니까? 기차/시험을 위한 클래스 밸런스 확인이 필요합니다. 아마도 0은 기차에, 1은 테스트에 들어갈 수 있습니다. 레이블을 구매 및 판매하여 별도의 클러스터링을 시도할 수도 있습니다.
믹싱은 GMM 생성 전에 수행됩니다.
그 전에 조건에 따라 레이블을 삭제합니다.
이것은 항상 작은 편차로 클래스의 균형을 1/1로 만듭니다.
이 경우 115개의 레이블을 섞어서 4부분으로 나누었습니다. 이후 이를 기반으로 4개의 GMM 모델을 만들었다. 각 샘플에서 1000개의 레이블이 샘플링되어 하나의 데이터 프레임으로 결합됩니다. 그 후, 기차와 테스트로 반으로 나뉩니다.
샘플 클래스의 균형은 이상과 약간 다릅니다. 그러나 기차와 테스트 샘플에서는 거의 동일한 비율이 나타났습니다.
다음은 115개 레이블의 동일한 샘플을 4개 부분으로 나누어 셔플링하지 않은 시뮬레이션 결과입니다. 물론 수업의 균형은 조금 나아지지만 이것이 결과에 큰 영향을 미치지 않는 것 같습니다.
아마도 어리석게 들릴지 모르지만 시리즈에는 GMM 모델이 시리즈의 다른 부분에서 찾을 수 있는 일종의 관계가 있는 것 같습니다. 행을 섞어서 순서를 어지럽히면 사라집니다.
따로 클러스터링은 생각 못했는데 저녁에 해봐야겠습니다.
믹싱은 GMM 생성 전에 수행됩니다.
그 전에 조건에 따라 레이블을 삭제합니다.
이것은 항상 작은 편차로 클래스의 균형을 1/1로 만듭니다.
이 경우 115개의 레이블을 섞어서 4부분으로 나누었습니다. 이후 이를 기반으로 4개의 GMM 모델을 만들었다. 각 샘플에서 1000개의 레이블이 샘플링되어 하나의 데이터 프레임으로 결합됩니다. 그 후, 기차와 테스트로 반으로 나뉩니다.
샘플 클래스의 균형은 이상과 약간 다릅니다. 그러나 기차와 테스트 샘플에서는 거의 동일한 비율이 나타났습니다.
다음은 115개 레이블의 동일한 샘플을 4개 부분으로 나누어 셔플링하지 않은 시뮬레이션 결과입니다. 물론 수업의 균형은 조금 나아지지만 이것이 결과에 큰 영향을 미치지 않는 것 같습니다.
아마도 어리석게 들릴지 모르지만 시리즈에는 GMM 모델이 시리즈의 다른 부분에서 찾을 수 있는 일종의 관계가 있는 것 같습니다. 행을 섞어서 순서를 어지럽히면 사라집니다.
따로 클러스터링은 생각 못했는데 저녁에 해봐야겠습니다.
그려야 해서 불명확 .. 뭐, 두 경우 모두 분포가 다르다는 것은 사실입니다. 또한 이미 직렬화를 제거했습니다. 대부분의 경우 분포는 매우 유익하지 않은 것으로 판명되었으며 샘플링 후 새로운 포인트는 이해할 수 없는 위치에 놓이기 시작합니다. 저것들. 연속된 정보가 손실됩니다. 예, 따옴표는 독립적이지 않습니다.
또는 따옴표가 아닌 간단한 예에서 수행하고 나중에 비교하십시오.
그려야 해서 불명확 .. 뭐, 두 경우 모두 분포가 다르다는 것은 사실입니다. 또한 직렬화를 이미 제거했습니다. 대부분의 경우 분포는 매우 유익하지 않은 것으로 판명되었으며 샘플링 후 새로운 포인트는 이해할 수 없는 위치에 놓이기 시작합니다. 저것들. 연속된 정보가 손실됩니다. 따옴표는 독립적이지 않습니다.
또는 따옴표가 아닌 간단한 예에서 수행하고 나중에 비교하십시오.
맥심, 안녕하세요. 나는 여기에 오랫동안 있지 않았습니다 ... 당신의 마지막 기사에 대해) 나는 결국 파이썬을 넣었습니다) 나는 그것을 알아 내려고 노력하고 있으며 많은 질문이 있습니다))) MARKUP은 이것이 내가 이해하는 방식입니다 확산? 현재 값을 현재 값 + 임의의 숫자와 비교하여 레이블을 배치합니다. > 또는 < 기호에 따라 레이블 1 또는 0을 넣습니다. 맞습니까? 테스트를 위해 markup=0.0을 설정합니까? 기차와 함께 MARKUP=0,00001 like))) 맞죠?
맥심, 안녕하세요. 나는 여기에 오랫동안 있지 않았습니다 ... 당신의 마지막 기사에 대해) 나는 결국 파이썬을 넣었습니다) 나는 그것을 알아 내려고 노력하고 있으며 많은 질문이 있습니다))) MARKUP은 이것이 내가 이해하는 방식입니다 확산? 현재 값을 현재 값 + 임의의 숫자와 비교하여 레이블을 배치합니다. > 또는 < 기호에 따라 레이블 1 또는 0을 넣습니다. 맞습니까? 테스트를 위해 markup=0.0을 설정합니까? 기차와 함께 MARKUP=0,00001 like))) 맞죠?
안녕하세요. 네, 맞습니다. 테스터에서는 동일한 마크업이 사용됩니다. 기사의 기사에 대해 묻는 것이 더 나을 것입니다. 한 곳에 있기 위해
피드백을 분석하고 개선할 수 있는 부분을 확인합니다.