Я проанализировал 378 588 статей Medium

Технологии продолжают ускоряться. Мир программного обеспечения также получает свою долю.

Существуют десятки языков программирования, и степень их использования со временем меняется в зависимости от тенденций в технологиях. В то время как слава некоторых языков быстро растет, некоторые языки постепенно разрушаются.

Как сказал Гераклит, единственное постоянное явление - это перемены. Конечно, языки программирования согласуются с этим глубоким убеждением.

Поэтому я думаю, что для разработчика программного обеспечения или кандидата в разработчики программного обеспечения очень важно следить за текущими разработками в области технологий, в частности языков программирования, и соответственно пересматривать свои карьерные планы.

Хотя я часто сосредотачиваюсь на работе, над которой работаю, и не смотрю на общую картину, я стараюсь быть в курсе последних событий, насколько это возможно.

Medium.com - один из самых важных каналов в этом отношении. Medium - это огромная блог-платформа с примерно 100 миллионами активных пользователей в месяц, и она поощряет своих пользователей создавать качественный контент с помощью своей партнерской программы.

Некоторое время назад я задавался вопросом, сколько историй, опубликованных на Medium, посвящено языкам программирования, и решил провести исследование.

Хотя они не имеют прямого отношения к моей профессии, такие исследования, связанные с наукой о данных, меня всегда волнуют.

Как я приобрел средние истории

Сделать это вручную у меня не получилось, так как историй тысячи. Чтобы облегчить себе работу, я разработал небольшое универсальное программное обеспечение, которое загружает метаданные историй. С помощью этого программного обеспечения, которое я разработал с использованием Python, вы можете загружать метаданные историй в формате JSON, указав любой желаемый тег.

Например, чтобы загрузить метаданные для историй с тегами Python, просто выполните следующую команду:

python medium_query.py collect-archive -t python

Или вы можете загрузить данные с этими тегами, введя тег в каждую строку текстового файла:

python medium_query.py collect-archive -f <filename>

Вы можете найти исходный код исследования в этом репозитории GitHub.

С помощью этого программного обеспечения я загрузил данные 378 588 историй с тэгами 25 самых популярных программ по индексу TIOBE.

На загрузку данных у меня ушло около шести часов, что составляло около 115 МБ, когда я их заархивировал.

Как я анализировал 378 588 историй

Используя эти данные, я проанализировал статистику языков программирования с 2014 по 2020 год и изменения популярности языков с течением времени.

Для этого я использовал Python и одну из самых важных его библиотек, pandas.

В таблице ниже вы можете найти общее количество статей по первым десяти языкам программирования.

С 2014 года JavaScript лидирует по огромной разнице в количестве историй.

На рисунке ниже вы можете увидеть график популярности языков программирования с течением времени.

Как ясно видно на этом графике, популярность Python унаследовала от JavaScript.

Для наглядности мне оставалось только нарисовать изменения в пяти основных языках программирования до ноября 2020 года.

Вы можете получить доступ к интерактивной версии этой графики, включая все языки и многое другое, на этой веб-странице.

При создании этой диаграммы я использовал метод, аналогичный методу, используемому для индекса TIOBE. Для каждого языка программирования в месячные сроки:

  1. Подсчитайте общее количество статей, помеченных определенным именем языка программирования.
  2. Разделите это число на общее количество статей и умножьте на 100 (общее значение за каждый месяц будет 100).

Кроме того, вдохновленный TIOBE, я перечислил языки программирования от наиболее предпочтительных до наименее предпочтительных в период с октября 2020 года по октябрь 2019 года. Вы можете увидеть это в таблице ниже.

Вы можете получить доступ к исходным кодам моего анализа и данным, которые я получил от Medium, на GitHub.

Я не буду здесь подробно оценивать результаты. Это потому, что он заслуживает дополнительной статьи, и я еще не готов к этому.

Однако я не могу не выразить свое скромное мнение по двум вопросам.

Танец Python и C

Мое первое мнение касается Python, который постоянно набирает обороты и захватывает JavaScript. Уже хорошо известно, что Python становится все более популярным языком.

Получив эти результаты, я лично стал свидетелем взлета Python.

Во-вторых, результаты содержат большие отличия по сравнению с индексом TIOBE.

Например, язык C занимает первое место в индексе TIOBE, но по полученным мною результатам он занимает 17-е место. Это огромная разница.

Как разработчик встроенного программного обеспечения, который постоянно использует язык C, я задаюсь вопросом, не наблюдаем ли мы одну из проблем, на которые я и мои коллеги жалуются в наших обсуждениях. Учитывая, что TIOBE - серьезная работа, на которую ссылаются в течение 20 лет - дает точные наблюдения за языками программирования, количество таких статей относительно C невелико, несмотря на его популярность.

Как я уже упоминал выше, я не буду здесь обсуждать причину этого. Однако буду очень рад, если вы поделитесь своими мыслями.

Нижняя линия

Конечно, можно больше подумать о результатах исследования и сделать разные комментарии. Я просто хотел пропустить эту часть и сразу же поделиться результатами.

Жду ваших комментариев, предложений и мнений.

Спасибо за чтение.