Мой статистический анализ (поиск стат. преимущества)

 
Хочу расказать как я провожу статистический анализ, надеюсь услышать аргументированную критику и предложения.
В статистическом анализе я использую тиковою историю котировок (мне кажется так анализ будет точнее), а точнее средню цену между ask и bid ((ask + bid) / 2), тейкпрофит TP и стоп лос SL использую одинаковые (TP = SL).
Введу несколько определение, которые я буду использовать:
- Параметр финансового инструмента - любой осциллирующий параметр, например скорость MA, расстояние между MA с разными периодами усрднения и т.п. Использую только осциллирующие (коллеблющиеся) параметры так как необходимо множество совпадений на исследуемом промежутке истории.
- Значение параметра. Как правило используемые мной параметры имеют не целое значение (например 1.4826582...) и в следствии этого сложно искать моменты с одинаковыми значениями параметров, так как в тиковой истории может просто не найтись одинаковых значений параметов. Поэтому используются диапазоны значений, то есть все значения попадающие в определенный диапазон от и до (например от 1.3457 до 1.589) условно равны между собой. Далее под значением параметра я буду использовать именно диапазон значений в который попадает значение параметра.
- Состояние финансового инструмента - любая комбинация параметров или даже один параметр. То есть условно говоря, финансовый инструмент в разные моменты времени имеющие одинаковые (или очень похожие) значения этих параметров, находится в одинаковом состояние в эти моменты времени. Я работаю с комбинациями до 4 параметров, объясню почему. Каждый параметр может принимать некоторое количество значени, например параметр 1 - может принимать 100 значений, параметр 2 - 50 значений, параметр 3 -70 значений. Тогда всего будет существовать 100 * 50 * 70 = 350000 состояний фин. инструмента. 350 000 это не моного, а вот если взять 5 параметров, по 60 значений, то получается 60 в 5-ой степени = 12 960 000 состояний. Учитывая что в моей тиковой истории в настоящий момент насчитывается около 40 000 000 тиков (примерно столько же в секундах), и если предположить что каждое из состояний равновероятны, то получается по 3,0864 тика на состояние. Какой тут можно проводить статистический анализ с такой частотой совпадений.
Смысл анализа в том что бы найти такие состояния фин. инструмента в которых более вероятна (по статистике) прибыльная покупка или прибыльная продажа с отпределнным TP=SL и использовать их при торговле.
Анализ производится следующим образом:
Беру тиковую историю, выбираю участок на котором будет производится поиск состояний со стат. преимуществом, оставляю участок истории для конечного испытиня. Для каждой секунды определяется прибыльна она для покупки или для продажи с определенным TP=SL. Определяются состояния для каждой секунды в истории. Для каждого состояния считается количество секунд прибыльных для покупки и прибыльных для продажи. Предположим для состояния A получилос 1489 секунд в продажу и 527 секунд в покупки, значит вероятнось получить прибыль при продаже в состоянии A составляет 1489 / (1489 + 527) * 100% = 73,8%.
Расчитываю таким образом все состояния и сохраняю те которые больше определенного процента (>55%, или >60%, или >65%).
Делаю проверку найденных состояний на втором отрезке истории.
Причина обращения: