Задача по преобразованию двух взаимосвязанных показателей в один - страница 4

 
Алексей Тарабанов:

Главный показатель - вес: Хочу быть тяжелым. 

Второстепенный - рост: Хочу быть высоким. 

Не приводится к одному показателю. Ортогональная система. 

Алексей Тарабанов:
Если Ваше предположение о взаимной связи двух показателей верно, то ищите другой способ описания Ваших предпочтений. Например, другую систему координат. 

Так конечно метрика изменится - я выше написал, что по у степень желания, а по x вариативность.

 
Aleksey Vyazmikin:

Так конечно метрика изменится - я выше написал, что по у степень желания, а по x вариативность.

Зависимость показателей с условной вероятностью не путайте. 

Безопасность полетов и надои молока. 

 
Aleksey Vyazmikin:

1 и 2 место - квадраты не сверху, а с права.

По поводу значимости коэффициентов, если  правильно понял, то

1 место kR == kP

2 место kR<kP

3 место kR>kP

4 место kR==kP

Правизна важнее - значит, k < 1 в формуле Z = P + k*R. А значения kR и kP всюду одинаковы, const. Только они уже не нужны, нужно лишь их отношение k = kP / kR, также одинаковое всюду.

О метриках. Подбор k в формуле для Z и будет означать выбор подходящей метрики в двумерном пространстве. Причем не любой, а той, у которой линия, точки которой находятся на расстоянии 1 от нулевой точки (единичная окружность в случае евклидовой метрики) является ромбом. k задает углы наклона его сторон. При k = 1 это был бы повернутый на 45 градусов единичный квадрат.

 
Не издевайся. Или, как скажешь. 
 
Aleksey Vyazmikin:

Я лучше расскажу для чего это нужно. Нужно это для получения универсального показателя целостности и полноты бинарной классификации.

имеем такую матрицу (таблица сопряженности)

TP - правильно классифицированные(предсказанные) 1

FP - неправильно классифицированные 1, а значит нули

FN - неправильно классифицированные 0, а значит 1

TN - правильно классифицированные 0

P=TP/(TP+FP)*100 - процент правильных от классифицированных как 1

R=TP/(TP+FN)*100 - процент правильных от класса 1

Соответственно значение там и там может быть от 0 до 100.

Логично, что к первой группе я отношу тех кто и к классу 1 отнес больше половины от всех и в этом отнесении оказался точен более чем на  50%. Соответственно, уменьшение числа (процента) единиц от всех единиц не так критично, если при этих событиях увеличивается точность - 2 группа. 3 и 4 по большому счету плохой результат, но я отдал приоритет объему единиц от всех, так-как при таком раскладе сохраняется шанс прибыльной торговли за счет числа сделок, даже если половина из них ошибочны.

Итоговые значения в виде числовых выражений назвать затрудняюсь - решения окончательного нет.

Теперь понятней?

Да, понятнее. Похоже на задачи, решаемые в ОТК предприятий (цитирую по прилагаемой публикации)

"Если контроль продукции производится на основе обследования только ее части (так называемый выборочный или статистический контроль качества), то возникает вероятность принятия ошибочного решения
о качестве контролируемого продукта. С некоторой вероятностью β процедура контроля может пропустить некондиционный продукт или, наоборот, с вероятностью α отклонить кондиционный. Вероятность β называется
риском потребителя, а вероятность α риском изготовителя."

В процитированной работе дальше делается попытка свести два критерия к одному. Может быть, Вам пригодится, страницы 133-135.

 
Алексей Тарабанов:
Не издевайся. Или, как скажешь. 

Пишу чистую правду. Проверяйте, подойдет или нет. Я же выкладываю выжимку, простейшая линейная функция Z = P + k*R при k < 1. Вы попросили помощи, чтобы, по сути, получить операцию сравнения в двумерном пространстве, где нет очевидного аналога сравнения чисел. В этом проблема, иначе Вы бы сами без вопросов сделали. Методы, которые там используются, обычно не входят в курс математики для инженеров. Вопрос о метриках поднял не я.

 
Алексей Тарабанов:

Зависимость показателей с условной вероятностью не путайте. 

Безопасность полетов и надои молока. 

Мне не понятно, что Вам непонятно. Обычно люди уточняют, ищут решение, а не "кряхтят", что "всё плохо".

 
Vladimir:

Пишу чистую правду. Проверяйте, подойдет или нет. Я же выкладываю выжимку, простейшая линейная функция Z = P + k*R при k < 1. Вы попросили помощи, чтобы, по сути, получить операцию сравнения в двумерном пространстве, где нет очевидного аналога сравнения чисел. В этом проблема, иначе Вы бы сами без вопросов сделали. Методы, которые там используются, обычно не входят в курс математики для инженеров. Вопрос о метриках поднял не я.

Помощь просил я, с документом сейчас ознакомлюсь, спасибо.


Vladimir:

Правизна важнее - значит, k < 1 в формуле Z = P + k*R. А значения kR и kP всюду одинаковы, const. Только они уже не нужны, нужно лишь их отношение k = kP / kR, также одинаковое всюду.

О метриках. Подбор k в формуле для Z и будет означать выбор подходящей метрики в двумерном пространстве. Причем не любой, а той, у которой линия, точки которой находятся на расстоянии 1 от нулевой точки (единичная окружность в случае евклидовой метрики) является ромбом. k задает углы наклона его сторон. При k = 1 это был бы повернутый на 45 градусов единичный квадрат.

Как осуществить подбор коэффициента - что-то я не соображу - чисто перебором?

 
Vladimir:

Да, понятнее. Похоже на задачи, решаемые в ОТК предприятий (цитирую по прилагаемой публикации)

"Если контроль продукции производится на основе обследования только ее части (так называемый выборочный или статистический контроль качества), то возникает вероятность принятия ошибочного решения
о качестве контролируемого продукта. С некоторой вероятностью β процедура контроля может пропустить некондиционный продукт или, наоборот, с вероятностью α отклонить кондиционный. Вероятность β называется
риском потребителя, а вероятность α риском изготовителя."

В процитированной работе дальше делается попытка свести два критерия к одному. Может быть, Вам пригодится, страницы 133-135.

Да, посмотрел я этот учебник, там похожая задача, но скорей идет речь о классификации бинарной с учетом двух показателей.

Формулы там для меня оказались неподъемными...

Думаю, что в итоге составлю матрицу решений с шагом 10, если не будет более красивого решения, которое я смогу воспроизвести в коде, ну или кто-то поможет воспроизвести это решение в коде.

 
Aleksey Vyazmikin:

Помощь просил я, с документом сейчас ознакомлюсь, спасибо.


Как осуществить подбор коэффициента - что-то я не соображу - чисто перебором?

Также, как Вы определили, что самое важное - в квадрате 1 и т.д. В помощь - наблюдайте за той самой единичной "окружностью", в данном случае, в первом квадранте (P > 0, R > 0), отрезком прямой линии Z=const - все такие линии для заданного k параллельны друг другу. Коэффициент k задает, в каком направлении идет линия, на которой наиболее трудно решить, какая ее точка лучше. И в то же время движение по перпендикуляру к ней наиболее очевидно меняет ситуацию в сторону лучше/хуже.

Причина обращения: