Главные тренды языков программирования: рост для больших данных

Главные тренды языков программирования: рост для больших данных

4 января 2017, 09:56
СанСаныч Фоменко
0
315

Теперь, когда IEEE Spectrum  третий год ранжирует языки, можно  посмотреть на некоторые тренды в течение этого времени. Какие языки господствующие? Которые теряют позиции? И который из источников данных, которые мы используем, чтобы создать наш рейтинг, способствуют больше всего этим сдвигам?

В этой статье я собираюсь фокусироваться на так называемых языках больших данных, таких как Julia, Python, R и Scala. Большинство из них специально созданы для обработки больших количеств числовых данных со стабильными пакетами, которые могут быстро проанализировать большое количество. Эти языки все более и более важны, поскольку они упрощают исследование огромных наборов данных, которые теперь обычно собираются через практически все секторы правительства, науки и коммерции.

 

Самым большим двигателем в этой категории был Go, язык с открытым исходным кодом, создаваемый Google, чтобы помочь решать проблемы компании с вычислением систем и параллельным программированием в 2007. В ранжировании  Spectrum  он повысился на 10 позиций с 2014, заняв 10-е место в этом году. Другие языки больших данных, которые видели перемещения с 2014 в ранжировании Spectrum, были R и Scala  с повышением R на 4 позиции и Scala  вверх 2. Julia  была добавлена к списку языков, которые мы отслеживаем в 2015, и в прошлом году он переместился с 40 на 33 позицию, все еще крайне проигрывая, но явно обладающий некоторым импульсом в его росте.

Главная причина быстрого повышения Go в нашем ранжировании – это значительное увеличение действия в архиве исходного кода GitHub. С 2014 общее количество репозиториев на GitHub.


Общий рейтинг


 

Рейтинг языков по запросам работодателей

 

Другой язык, который продолжал повышать рейтинг с 2014, является R, занимающий теперь пятое место. R поднялся в нашем рейтинге за счет вопросов на Stack Overflow - приблизительно на 46 процентов по сравнению с 2014. Но еще более важным для повышения R является то, что он все более и более упоминается в академических научно-исследовательских работах. Ранжирование Spectrum   по умолчанию в большой степени взвешено к данным от IEEE Xplore, который индексирует миллионы академических статей, стандартов и фиксирует в базе данных IEEE. В нашем рейтинге 2015 года существовало  39 статей, говорящих о языке, тогда как в этом году мы зарегистрировали 244 статьи.



Рейтинг языков среди открытых источников

Вопреки существенному росту рейтинга языков с открытым исходным кодом такими как Go, Julia, R и Scala идет снижение таких языков анализа данных, как Matlab и SAS: Matlab понизился на четыре места в рейтинге с 2014, а SAS на семь. Однако важно отметить, что оба эти языка все еще растут; просто, что они не растут с такой скоростью, как некоторые языки и поэтому относительно них отстают.

Когда мы взвешиваем рейтинг по найму на работу, то  продолжаем видеть доминирование Java и Python. Но фирмы по поиску и набору персонала в четыре раза больше интересуются R в 2016 по сравнению с 2014.

 Этот рост ставит вопрос, может ли R когда-либо превзойти Python или Java как главных языков для больших данных.

 

Но в то время как R демонстрирует огромный рост за последние несколько лет, Python и Java действительно - гориллы за 800 фунтов. Например, мы нашли примерно в 15 раз больше предложений работы для программистов на Python по сравнению с  разработчиками на R. И в то время как мы нашли приблизительно 63 000 новых репозиториев GitHub в прошлом году для R в противовес закрытых около 458 000 для Python. Несмотря на то, что R может быть лучше для визуализации и исследовательского анализа и явно нравится академикам, пишущим научно-исследовательские работы,  то у Python есть значимые преимущества для пользователей в области производства: он более легко интегрируется в производственные цепочки, и как язык общего назначения  у него попросту более широкий круг пользователей.

 

 Эти данные иллюстрируют, что несмотря на желание некоторых кодеров оценить языки на чисто внутренних достоинствах - элегантность их синтаксиса, или степени естественности используемой абстрактности используемый - наибольшим драйвером популярности языка всегда будет области, для которых они предназначаются, или проектом или доступностью поддерживаемых библиотек.


 

 

Поделитесь с друзьями: