Очистка массива от заданного (ых) элементов - страница 8

 
что такое мт4 не знаю, оно у меня даже запускаться не захотело на win10, думаю что и слава богу
 
Maxim Dmitrievsky:
что такое мт4 не знаю, оно у меня даже запускаться не захотело на win10, думаю что и слава богу
Хорошо сказано:)
 

До кучи подкрутил.

void OnStart()
{
     long array[], arr[] = {1, 2, 3, 6, 9, 5, 6, 3, 25, , , 6, 8, NULL, 7, NULL, 4, 45};
     ArrayCopy(array, arr); 
//--
  #ifdef __MQL5__
     Print( arrayFilter(array, array[2]) );
     ArrayPrint( array );
  #else
     string s = arrayFilter(array, array[2]) + " {";
     
     for(int i=0; i<ArraySize(array); i++)
     {
          s += array[i];
          if(i<ArraySize(array)-1)
               s += ", ";
     }
     
     Print( s+" }" );
  #endif
}
//---------------------------------------------------------------
template<typename T>
int arrayFilter(T &data[], const T value)
{
     int d = ArraySize(data), j = 0, y = 0;
     
     for(int i=0; i<d; i++, y++)
     {
          if(j>0)
               data[y] = data[y + j];
          
          if(data[i] == value || data[i] == NULL)
          {
               y--;
               j++;
          }
     }
  
     if(d > y)
          ArrayResize(data, y);
     
     return y;
}

Пришлось загнать ArrayCopy т.к. на MQL5 ругался что массив статичный.


 
Nikolai Semko:

Ну если уж пошла такая пьянка-соревновалка по скорости, то предложу и свой вариант...

Ваш вариант действительно самый быстрый, но он содержит ошибку: если все элементы массива равны фильтру, Ваша функция вылетает за пределы массива.

Предложу свой вариант, он немного уступает Вашему в скорости:

int ArrayModify(int &a[],const int v)
  {
   int size=ArraySize(a)-1;
   int j=0;
   int total=size;
   for(int i=0;i<size;i++)
     {
      while(a[i+j]==v && j<total)
        {
         j++;
         size--;
        }
      a[i]=a[i+j];
     }
   size=ArrayResize(a,size);
   return(size);
  }


2018.11.13 17:16:38.618 massiv v1 (EURUSD,M1) test мой=1512090
2018.11.13 17:16:40.083 massiv v1 (EURUSD,M1) test чужой=1464941

 
Vasiliy Sokolov:

Вы уже несколько лет задаете подобные вопросы. Многому научились? Извините, но видно что Вы как ковырялись на уровне байтов и элементарных массивов, так и остались там. 

Сам вопрос сформулирован неверно. Задача не в удалении повторяющихся значений (задача уровня ОГЭ) а в нечто большем, по всей видимости актуализируете список валидных элементов. Раз так, то и вопрос совсем иначе должен звучать. Вы же запутываете и вводите в заблуждение участников и прежде всего себя: навязывайте участникам неверное решение в принципе и просите его сделать эффективным.

Я не занимаюсь программированием ради программирования, цели стать мега программистом и умничать на форумах нет.

Что Вам не понятно в вопросе: Очистить массив от заданных элементов ?

 
Sergey Pavlov:

Ваш вариант действительно самый быстрый, но он содержит ошибку: если все элементы массива равны фильтру, Ваша функция вылетает за пределы массива.

Предложу свой вариант, он немного уступает Вашему в скорости:


2018.11.13 17:16:38.618 massiv v1 (EURUSD,M1) test мой=1512090
2018.11.13 17:16:40.083 massiv v1 (EURUSD,M1) test чужой=1464941

Да, спасибо. Поправил.

int ArrayDeleteVal(int &a[],const int val) // вариант Semko
  {
   int size=ArraySize(a);
   int i=0,start,s,count;
   while(i<size && a[i]!=val) i++; // ищем первый элемент массива со значением val
   if(i==size) return size;
   start=i; i++;  
   while(i<size && a[i]==val) i++; // ищем элемент массива со значением, не равным val
   if(i==size) {ArrayResize(a,0); return 0;}
   s=i; i++;
   while(true)
     {
      while(i<size && a[i]!=val) i++; // ищем элемент массива со значением val
      count=i-s;
      if(count>6) { ArrayCopy(a,a,start,s,count); start+=count;} // если нужно скопировать более 6 элементов, то имеет смысл воспользоваться ArrayCopy
      else for(; s<i; start++,s++) a[start]=a[s];                // иначе простой цикл
      if(i==size) break;
      i++;
      while(i<size && a[i]==val) i++; // ищем элемент массива со значением, не равным val
      if(i<size) s=i; else break;
      i++;
     }
   if(start<size) ArrayResize(a,start); else start=size;
   return(start);
  }

Только у Вас где-то тоже ошибка, т.к. контрольная сумма не совпадает, т.к. теряет один элемент где-то. Не разбирался где.

2018.11.13 10:07:27.757 ArrayDeleteValue (EURUSD,D1)    вариант Pastushak: Контрольная сумма = 495782577; элементов - 999027; время выполнения = 156757 микросекунд
2018.11.13 10:07:27.761 ArrayDeleteValue (EURUSD,D1)    вариант Korotky:   Контрольная сумма = 495782577; элементов - 999027; время выполнения = 2338 микросекунд
2018.11.13 10:07:27.764 ArrayDeleteValue (EURUSD,D1)    вариант Fedoseev:  Контрольная сумма = 495782577; элементов - 999027; время выполнения = 1839 микросекунд
2018.11.13 10:07:27.766 ArrayDeleteValue (EURUSD,D1)    вариант Semko:     Контрольная сумма = 495782577; элементов - 999027; время выполнения = 782 микросекунд
2018.11.13 10:07:27.770 ArrayDeleteValue (EURUSD,D1)    вариант Pavlov:    Контрольная сумма = 495781718; элементов - 999026; время выполнения = 2886 микросекунд
2018.11.13 10:07:27.773 ArrayDeleteValue (EURUSD,D1)    вариант Nikitin:   Контрольная сумма = 495782577; элементов - 999027; время выполнения = 2355 микросекунд
Файлы:
 

Подправил, убрав лишние проходы

void OnStart()
{
     long array[], arr[] = {1, 2, 3, 6, 9, 5, 6, 3, 25, , , 6, 8, NULL, 7, NULL, 4, 45};
     ArrayCopy(array, arr);
//--
  #ifdef __MQL5__
     Print( arrayFilter(array, (long)3) );
     ArrayPrint( array );
  #else
     string s = arrayFilter(array, (long)3) + " {";
     
     for(int i=0; i<ArraySize(array); i++)
     {
          s += array[i];
          if(i<ArraySize(array)-1)
               s += ", ";
     }
     
     Print( s+" }" );
  #endif
}
//---------------------------------------------------------------
template<typename T>
int arrayFilter(T &data[], const T value=NULL)
{
     int d = ArraySize(data), y = 0;
     
     for(int i=0, j=0; i<d; i++, y++)
     {
          bool res = false;
          while(data[i] == value || data[i] == NULL)
          {
               res = true;
               j++;
            //---
               if(i+1==d)
                    break;
               if(data[i+1] == value || data[i+1] == NULL)
                    i++;
               else
                    break;
          }
          
          if(j>0)
          {
               if(d==y+j)
                    break;
               data[y] = data[y + j];
          }
          if(res)
               y--;
     }
  
     if(d > y)
          ArrayResize(data, y);
     
     return y;
}
 
Nikolai Semko:
В обоих случаях каждый элемент перетаскивается максимум один раз.

Да, извините, действительно, один раз. Надеялся, кто-нибудь заинтересуется подходом из СУБД и проверит, не дождался. Пришлось самому.

int ArrayDelV (int &a[],const int val) { // вариант Vladimir
bool Flags[]; // массив пометок на удаление
int N, NewN, i, j;
N=ArraySize(a);
ArrayResize(Flags,N);
//if (ArrayInitialize(Flags,false)!=N) return(-1);
NewN=N; // Сколько останется
for (i=0;i<N;i++) {if (a[i]==val) {Flags[i]=true; NewN--;}}
j=0;
for (i=0;i<N;i++) {if (Flags[i]) {a[j]=a[i]; j++;}}
ArrayResize(a,NewN);
return(NewN);
}

Вставил в Вашу проверялку ArrayDeleteValue.mq5, вышло хуже, чем у Вас, раза в два. Подумал о причинах и поправил в ней две строчки, чтобы удалялась треть элементов, а не 0.1%.

   for(int i=0; i<1000000;i++) arr[i]=rand()%3;// 1000; //генерируем исходный массив случайными значениями от 0 до 1000
   int Value=rand()%3; // 1000; // значение, которое нужно удалить из массива

Вышло так:

2018.11.13 19:45:22.148 Del (GBPUSD.m,H1) вариант Pastushak: Контрольная сумма = 333586; элементов - 667421; время выполнения = 108521 микросекунд
2018.11.13 19:45:22.148 Del (GBPUSD.m,H1) вариант Korotky:   Контрольная сумма = 333586; элементов - 667421; время выполнения = 5525 микросекунд
2018.11.13 19:45:22.148 Del (GBPUSD.m,H1) вариант Fedoseev:  Контрольная сумма = 333586; элементов - 667421; время выполнения = 4879 микросекунд
2018.11.13 19:45:22.164 Del (GBPUSD.m,H1) вариант Semko:     Контрольная сумма = 333586; элементов - 667421; время выполнения = 14479 микросекунд
2018.11.13 19:45:22.179 Del (GBPUSD.m,H1) вариант Pavlov:    Контрольная сумма = 998744; элементов - 667421; время выполнения = 0 микросекунд
2018.11.13 19:45:22.179 Del (GBPUSD.m,H1) вариант Nikitin:   Контрольная сумма = 333586; элементов - 667421; время выполнения = 5759 микросекунд
2018.11.13 19:45:22.179 Del (GBPUSD.m,H1) вариант Vladimir:   Контрольная сумма = 333586; элементов - 667421; время выполнения = 1542 микросекунд

Вариант Pavlov давал ошибку, пришлось закомментировать.

Вывод: вычисление адресов в массиве с произвольным расстоянием между их номерами все же хуже, чем обработка элементов подряд, при заданном шаге, тем более шаге 1, компилятор может ее оптимизировать.

P.S. В компиляторах от Borland для Паскаля и Delphi делается так, что во время исполнения цикла переменная цикла не имеет значения (в памяти), она помещается куда-то в регистры процессора.

 
Vladimir:

Да, извините, действительно, один раз. Надеялся, кто-нибудь заинтересуется подходом из СУБД и проверит, не дождался. Пришлось самому.

Вставил в Вашу проверялку ArrayDeleteValue.mq5, вышло хуже, чем у Вас, раза в два. Подумал о причинах и поправил в ней две строчки, чтобы удалялась треть элементов, а не 0.1%.

Вышло так:

2018.11.13 19:45:22.148 Del (GBPUSD.m,H1) вариант Pastushak: Контрольная сумма = 333586; элементов - 667421; время выполнения = 108521 микросекунд
2018.11.13 19:45:22.148 Del (GBPUSD.m,H1) вариант Korotky:   Контрольная сумма = 333586; элементов - 667421; время выполнения = 5525 микросекунд
2018.11.13 19:45:22.148 Del (GBPUSD.m,H1) вариант Fedoseev:  Контрольная сумма = 333586; элементов - 667421; время выполнения = 4879 микросекунд
2018.11.13 19:45:22.164 Del (GBPUSD.m,H1) вариант Semko:     Контрольная сумма = 333586; элементов - 667421; время выполнения = 14479 микросекунд
2018.11.13 19:45:22.179 Del (GBPUSD.m,H1) вариант Pavlov:    Контрольная сумма = 998744; элементов - 667421; время выполнения = 0 микросекунд
2018.11.13 19:45:22.179 Del (GBPUSD.m,H1) вариант Nikitin:   Контрольная сумма = 333586; элементов - 667421; время выполнения = 5759 микросекунд
2018.11.13 19:45:22.179 Del (GBPUSD.m,H1) вариант Vladimir:   Контрольная сумма = 333586; элементов - 667421; время выполнения = 1542 микросекунд

Вариант Pavlov давал ошибку, пришлось закомментировать.

Вывод: вычисление адресов в массиве с произвольным расстоянием между их номерами все же хуже, чем обработка элементов подряд, при заданном шаге, тем более шаге 1, компилятор может ее оптимизировать.

P.S. В компиляторах от Borland для Паскаля и Delphi делается так, что во время исполнения цикла переменная цикла не имеет значения (в памяти), она помещается куда-то в регистры процессора.

Вариант Павлова исправил.
Странные у вас значения получились. Может Вы скрипт запускали после профилирования или отладчика, не перекомпилировав код? 
У меня так получается:

2018.11.13 12:35:38.633 ArrayDeleteValue (EURUSD,D1)    вариант Pastushak: Контрольная сумма = 496494849; элементов - 999011; время выполнения = 131964 микросекунд
2018.11.13 12:35:38.636 ArrayDeleteValue (EURUSD,D1)    вариант Korotky:   Контрольная сумма = 496494849; элементов - 999011; время выполнения = 2310 микросекунд
2018.11.13 12:35:38.639 ArrayDeleteValue (EURUSD,D1)    вариант Fedoseev:  Контрольная сумма = 496494849; элементов - 999011; время выполнения = 1834 микросекунд
2018.11.13 12:35:38.641 ArrayDeleteValue (EURUSD,D1)    вариант Semko:     Контрольная сумма = 496494849; элементов - 999011; время выполнения = 773 микросекунд
2018.11.13 12:35:38.645 ArrayDeleteValue (EURUSD,D1)    вариант Pavlov:    Контрольная сумма = 496494849; элементов - 999011; время выполнения = 2815 микросекунд
2018.11.13 12:35:38.648 ArrayDeleteValue (EURUSD,D1)    вариант Nikitin:   Контрольная сумма = 496494849; элементов - 999011; время выполнения = 2475 микросекунд
2018.11.13 12:35:38.653 ArrayDeleteValue (EURUSD,D1)    вариант Vladimir:  Контрольная сумма = 496656342; элементов - 999011; время выполнения = 3608 микросекунд

Причем в Вашем варианте выдает неправильную контрольную сумму. Да и вообще создание дополнительного массива не дает никакой выгоды, а наоборот тормозит процесс, да еще и дополнительные ресурсы ест. 

Файлы:
 
По сути у всех алгоритмы одинаковые. Все выполняют модификацию массива поэлементно и все стремятся к варианту Федосеева, т.к. у него нет ничего лишнего.
Только у меня это происходит блоками с помощью ArrayCopy, поэтому выйгрыш в скорости и существует. 
Причина обращения: