Старшие журналисты по анализу данных Клара Гибург и Нассос Стилиану объясняют, как принятие языка программирования R упростило рабочий процесс с графикой в ​​BBC News.

На последнем мероприятии Hacks / Hackers в Лондоне Клара Гибург и Нассос Стилиану из команды BBC Visual and Data Journalism рассказали, как их команда за последний год обновила свой рабочий процесс с графикой, разработав bbplot - настроенная версия пакета ggplot2 - для R .

Пакет повысил продуктивность журналистов, предоставив больше автономии группе данных и освободив команду графиков от создания одних и тех же диаграмм снова и снова. Как объяснил Гибург: «В группе данных мы использовали R для анализа данных в течение довольно долгого времени, но когда дело дошло до создания диаграмм, у нас было два варианта: если это было быстрое решение проблемы, мы сделали это сами. , используя собственный инструмент построения диаграмм, если бы у нас было больше времени, мы бы заказали диаграмму у наших дизайнеров ».

В прошлом году группа специалистов по обработке данных начала думать, что для их рабочего процесса было бы намного лучше делать все в одном месте и «переходить от этапа анализа к готовой к публикации диаграмме в рамках одного инструмента», - сказал Гибург.

В марте 2018 года десять членов группы по обработке данных начали экспериментировать, опубликовав первую диаграмму BBC, составленную от начала до конца на языке R в марте 2018 года. С тех пор команда разработала кулинарную книгу на R с открытым исходным кодом - который представляет собой готовый сборник инструкций по настройке чего-то, что каждый может скопировать или прочитать, чтобы изучить на примерах.

Вы можете посмотреть Полное выступление Гибура и Стилиану на нашем канале YouTube и прочитать ниже наши основные выводы.

Почему BBC выбрала R?

R - это язык статистического программирования, используемый многими редакциями новостей для анализа данных. При использовании в сочетании с пакетом визуализации ggplot2 программное обеспечение можно использовать для отображения распределения больших наборов данных и быстрого преобразования его в диаграмму.

«Мы обнаружили много преимуществ с R. Это дает вам больше свободы с точки зрения того, как вы хотите, чтобы ваша диаграмма выглядела. Поскольку сейчас мы работаем со сценариями, все становится намного более воспроизводимым », - сказал Гибург.

Bbplot позволяет экспортировать диаграммы в стиле BBC всего за несколько шагов, которые не нуждаются в каких-либо дополнительных изменениях. Кроме того, по словам Гибура, работа со сценариями экономит время, особенно при обновлении диаграмм для истории.

Как журналисты BBC используют bbplot и кулинарную книгу

Пакет был разработан, чтобы упростить процесс создания диаграмм. Таким образом, основная функция инструмента - быстрое создание графики в стиле веб-сайта BBC News. Программа использует две функции: bbc_style () и finalise_plot ().

Функция bbc_style () изменяет внешний вид ggplot2 по умолчанию на стиль BBC. Он изменяет аргументы в теме. Как написано в Поваренной книге, функция не изменяется и не адаптируется в зависимости от типа диаграммы, которую вы составляете, поэтому могут потребоваться дополнительные изменения в последнюю минуту. Он определяет размер текста, размер шрифта, цвет, ось и другие основные компоненты.

Согласно BBC: «Идея заключалась в том, что bbc_style (), функция, которую мы создали для изменения внешнего вида ggplot2 по умолчанию на наш собственный стиль, должна дать вам 90% пути, оставляя вам возможность вносить любые дополнительные настройки в свой диаграмму, а не похоже на инструмент диаграммы, который только что представил вам готовую графику и мало места для маневра ».

Вторая функция пакета, finalise_plot (), представляет последний шаг процесса, делая окончательные корректировки перед экспортом и, согласно поваренной книге, выравнивает заголовок, подзаголовок по левому краю и добавляет нижний колонтитул с источником и изображение в правом нижнем углу вашего сюжета. Он также сохранит его в указанном вами месте .

Наконец, поваренная книга собирает знания команды. Каждый раз, когда член команды разрабатывает новый сценарий, код попадает в руководство и становится доступным для всей команды, а через пару месяцев - для каждого журналиста, который хочет поэкспериментировать с инструментом.

Как BBC удалось осуществить переход?

Нелегко изменить рабочий процесс в такой масштабной рабочей среде, как BBC, но «нам, по сути, удалось добиться успеха», - сказал Нассос Стилиану.

Группа данных исследовала в Интернете, как другие программисты ранее решали ту же проблему: «В этом не было ничего нового, это просто заставляло вещи работать на нас и объединяло их в одном месте», - сказал Стилиану.

Ключом к успеху было то, что «переход не был обязанностью одного человека». Группа данных начала использовать канал Slack для обмена фрагментами кода друг с другом, и каждый член группы данных помогал с этой функцией коллективными усилиями.

«Переход сработал, потому что это было коллективное усилие. Каждый человек как бы опирался на работу другого человека, и мы действительно работали вместе, чтобы достичь этого », - сказал Стилиану.

Хотите присоединиться к Hacks / Hackers London в следующем месяце? Посетите наш сайт, чтобы узнать о будущих мероприятиях и приглашенных спикерах. Вы можете посмотреть выступления с предыдущих встреч на нашем YouTube канале и подписаться на нас в Twitter и Facebook.