Глобальные вызовы и важность актуальных и своевременных данных

Восстановление мировой экономики — Продовольственная безопасность — Доступ к соответствующим данным

Это были основные темы разговоров в Джокьякарте, Индонезия, на Международной конференции ООН по большим данным. Это мероприятие, организованное Отделом больших данных UNSTATS, предложило участникам разнообразные возможности, начиная от диалогов с экспертами, обсуждения новых инструментов и подходов, практических семинаров и хакатона для внедрения инноваций.

Пятидневная конференция преследовала четыре цели:

  • Выявление глобальных проблем, связанных с предоставлением официальной статистики, и уточнение важности актуальных и своевременных данных для поддержки политических решений.
  • Использование статистики, методов и статистического анализа с использованием науки о данных
  • Использование больших данных в качестве современного источника данных для официальной статистики
  • Распространение последних исследований в области науки о данных

В этом посте мы представляем сводки всех сессий, сделанных на конференции, включая доступ к почти 60 часам видео. Не забудьте также посетить официальный сайт конференции для получения дополнительной информации:



Обзоры сеансов

Конференция по большим данным проходила в течение пяти дней и предлагала несколько одновременных сессий. Ниже вы можете получить доступ к видео всех сессий и прочитать наши резюме.

Понедельник, 07 ноября, пленарные заседания

  • Открытие сессии
  • Устойчивое развитие и восстановление мировой экономики
  • Продовольственная безопасность
  • Доступ к соответствующим данным

Вторник, 8 ноября, пленарные заседания

  • 10 лет инноваций в области данных: что будет дальше?
  • Хакатон ООН по большим данным и конкурс UN PET Lab
  • Пленарные заседания: Развитие потенциала и региональные центры, Большие данные и ЦУР, Данные мобильных телефонов для официальной статистики, Доступ к данным и наука о данных

Среда, 09 ноября, Зал A

  • Лаборатория ПЭТ ООН
  • Данные наблюдения Земли

Среда, 9 ноября, комната B

  • Данные АИС

Четверг, 10 ноября, зал А

  • Данные наблюдения Земли
  • Данные мобильного телефона

Четверг, 10 ноября, зал B

  • Доступ к данным и машинное обучение
  • Машинное обучение

Пятница, 11 ноября, Зал A

  • Данные мобильного телефона

Пятница, 11 ноября, зал B и пленарные заседания

  • Машинное обучение
  • Заключительная сессия

Примечание. Продолжая тему работы с большими источниками данных, команда SDGCounting использовала инструменты обработки естественного языка, чтобы подвести итоги этих сессий.

День 1 (пленарное заседание)

Программа сессии

  • Открытие сессии
  • Устойчивое развитие и восстановление мировой экономики
  • Продовольственная безопасность
  • Доступ к соответствующим данным

Ключевые слова

данные, политики, большие данные, экономическая статистика, официальная статистика, женщины, политика, вызовы, инфляция, продовольственная безопасность, данные, доступ, информационная безопасность.

Контур

  • Добро пожаловать
  • Представляем основного докладчика.
  • В хакатоне принимают участие молодые статистики со всего мира.
  • видео
  • Большие данные, большие данные и еще раз большие данные.
  • Доктор Хамза Али Малик.
  • ВВП на душу населения и неравенство с 1980 года.
  • Мировая экономика движется к дальнейшему замедлению экономического роста в 2020 году.
  • Влияние фискальных мер на экономику Азиатско-Тихоокеанского региона.
  • Фискальные меры и многосторонние подходы для создания фискального пространства.
  • Важность данных и то, как политики могут их использовать.
  • Почему мы недостаточно делаем для защиты экосистем.
  • Роль правительства в преодолении разрыва между частным сектором и государственным сектором.
  • Как сохранить разнообразие подходов, используя при этом согласованный подход?
  • Вторая панель высокого уровня посвящена продовольственной безопасности.
  • Какова роль больших данных в информировании политики продовольственной безопасности?
  • Что нам нужно, так это уметь обнаруживать и обнаруживать неравенство, признавая при этом, что мы живем в разнообразном мире.
  • Какие ключевые проблемы еще предстоит решить?
  • Почему нам нужно переосмыслить этику работы с данными дальше.
  • Какая следующая сельскохозяйственная перепись в Индонезии?
  • Как продовольственная безопасность соотносится с международным уровнем?
  • Как можно более динамично отслеживать ситуацию с продовольственной безопасностью?
  • Необходимость в дополнительных данных об отсутствии продовольственной безопасности в Индонезии.
  • Почему центральное правительство решило создать центр обработки данных внутри Федеральной администрации.
  • Какова роль официального статистика в будущем?
  • Ключевым шагом в любом путешествии по интеграции данных является доступ к соответствующим данным.
  • Каковы проблемы? Каковы препятствия? Каков наилучший подход?
  • Донесение ценности данных до общественности.
  • ООН была в центре внимания целевой группы по технологиям повышения конфиденциальности.
  • Каковы риски, связанные с объединением всех данных?
  • Закрытие

День 2 (Пленарное заседание)

Программа сессии

  • 10 лет инноваций в области данных: что будет дальше?
  • Хакатон ООН по большим данным и конкурс UN PET Lab
  • Пленарные заседания: Развитие потенциала и региональные центры, Большие данные и ЦУР, Данные мобильных телефонов для официальной статистики, Доступ к данным и наука о данных

Ключевые слова

данные, задача, статистика, региональные хабы, наука, официальная статистика, команда, хакатон, большие данные, ЦУР, вызовы, статистики, официальная статистика, mpd, качество, частный сектор, методология, мобильный телефон, доступ, ИКТ.

Контур

  • Введение
  • Чем занимались рабочие группы в 2019 году.
  • Официально создана Глобальная платформа ООН по большим данным (ЮНЭЙДС).
  • Что происходит в Азиатско-Тихоокеанском регионе?
  • Что происходит на Глобальной платформе?
  • Какова роль региональных хабов? Какова потребность в более устойчивой и устойчивой форме сотрудничества?
  • Важность создания сетей и получения мнений других организаций.
  • Кто должен нести ответственность за соединение с региональными узлами?
  • Как нам укрепить наше сотрудничество с геопространственным сообществом?
  • В чем преимущества глобального цифрового двойника?
  • Каковы приоритеты разных стран и как мы можем на это реагировать?
  • Глобальная группа управления геопространственной информацией (ГИС) ЮНИСЕФ имеет совершенно другое сообщество, чем подразделение ГИС.
  • Какова цель ведущей сети Data Science?
  • Какова цель бюро? Каковы основные функции и область применения? Каков охват?
  • Как мы можем убедиться, что все эти боящиеся люди используют науку о данных?
  • Каковы насущные проблемы для группы по анализу данных в статистическом управлении?
  • Какова роль науки о данных в правительстве?
  • Официальная статистика в больших данных — это огромная тема.
  • Важность лучшего доступа к данным за пределами вашего сообщества.
  • Кому нужна аккредитация для такого решения?
  • Какова конфиденциальность данных о здоровье и как их можно защитить?
  • Как лаборатория PTT поможет производителям данных понять конфиденциальность.
  • Хотим ли мы иметь декларацию Картера? Или нет?
  • Что должно быть в Джокьякартской декларации?
  • Как продолжить обсуждение создания центра науки о данных в Азии.
  • Могут ли новые технологии и данные помочь украинской статистике?
  • Хакатон — это большое дело.
  • Что сейчас происходит во всем мире в статистическом сообществе.
  • Хакатон Un Big Data: бразильский центр.
  • Старт хакатона.
  • Каков подход к Африканскому хабу?
  • Важность вовлечения молодежи в экосистему.
  • Какие ключевые темы возникли на этапе сбора данных?
  • Первая отправная точка для сотрудничества — показать важность предмета.
  • Как мы делимся? Как мы учимся?
  • Как вы взаимодействуете с академическими кругами?
  • О каких проблемах вы, возможно, захотите подумать при создании проектов по работе с большими данными?
  • Что мы можем узнать из успешного применения?
  • Индонезия является ведущей страной в Азиатско-Тихоокеанском регионе с наибольшим количеством доступных данных для S&P/IPS.
  • Почему нам нужен еще один источник данных, а не только MPD.
  • Министерство цифрового развития и коммуникаций (ЦРТ).
  • Использование данных сканирования для богатой статистики цен.
  • У вас есть какие-либо вопросы или комментарии или вы хотите поделиться своим опытом?
  • Какова стоимость использования этих источников данных в качестве наблюдения?
  • Какие ключевые ресурсы вам понадобились для реализации этих проектов?
  • Основы данных MPD.
  • Какая страна платит за внедрение больших данных для статистических целей?
  • Как вы справляетесь с проблемами приватности, конфиденциальности и конкуренции?
  • Какова роль научных кругов в продвижении использования MPD в НСУ?
  • Как эти проблемы могут быть решены в качестве методологии.
  • Какие бесплатные инструменты может использовать NSAA для изучения данных мобильных телефонов?
  • Национальная координация в отношении обмена данными.
  • Когда вы выбираете, получать данные от телефонных провайдеров или проводить анализ самостоятельно?
  • Панельная дискуссия о доступе к данным и науке о данных.
  • Как наши данные использовались в других странах.
  • Как вы определяете семь шагов от получения до приема данных?
  • Проблемы, которые возникли в результате проекта.
  • В чем важность качества?
  • Обеспечение качества данных.
  • Не пора ли переосмыслить роль официальной статистики?

День 3 (Комната А)

Программа сессии

  • Лаборатория ПЭТ ООН
  • Данные наблюдения Земли

Ключевые слова

данные, ИИ, код, индикаторы, доступ, статистика, информация, официальная статистика, доставка, вопросы, методы, визуализация, кластеры, процесс, алгоритм.

Контур

  • Знакомство с мастерской.
  • Сколько у вас данных?
  • В Австралии есть проект, который изучает отчеты о перегрузках, а также фактическое место назначения чипов.
  • Каково покрытие источника данных с точки зрения типа формы?
  • Что вы будете делать с данными, если свяжете их с другой информацией?
  • Что такое данные AAS и как они работают?
  • Как подключиться к серверу D365.
  • Панель инструментов лаборатории Юпитера.
  • Как извлечь данные в Spark DataFrame.
  • Как отфильтровать результаты.
  • Почему важно сделать доступной лучшую статистику.
  • Важность наличия геопространственного эксперта в вашей команде.
  • Откуда взялись геометрии и как они появились?
  • Метод № 1: метод пересечения границы.
  • Что такое брелок? Как это работает?
  • Важность сопоставления с официальной статистикой.
  • Каким вы видите последний этап включения этих данных в официальную статистику?
  • Демонстрация №1: Запись данных в корзину S3 с помощью Python.
  • Получение данных из FITCH.
  • Как проверить свои данные в разработке.
  • Что мы будем делать с этими данными?
  • Какие данные из него выходят?
  • Тепловая карта Одессы.
  • Каковы плюсы и минусы каждого алгоритма кластеризации?
  • Использование индексов H3 для упрощения кластеризации с использованием больших данных.
  • Как определить минимальное количество точек в вашей модели.
  • Предостережения и ограничения метода.
  • Как насчет стабильности? Как убедиться, что ваша статистика по-прежнему актуальна?
  • Как мы можем расширить глобальную платформу ООН?
  • Важность наличия плана проблемы для начала.

День 3 (Комната Б)

Программа сессии

  • Данные АИС

Ключевые слова

данные, дифференциальная конфиденциальность, набор данных, статистика, шум, УВКБ, федеративный, мастерская, анклавы, эпсилон, карта, фао, изображения, геопространственная, официальная статистика, наблюдение, статистика, точность, мониторинг, метод, данные наблюдения Земли.

Контур

  • Знакомство с сегодняшней программой.
  • Какова роль официальной статистики в будущем?
  • Существуют ли способы сделать это автоматизированным и обеспечить контроль и гарантии, чтобы информация, которую вы предоставляете, не могла быть подвергнута обратному проектированию?
  • Что такое безопасный анклав и как он работает?
  • Почему федеративное обучение не воспроизводимо.
  • Вы сообщаете о количестве добавленного шума?
  • Подход на практике.
  • Что означает использование технологий повышения конфиденциальности с юридической точки зрения?
  • Как эти технологии уже используются?
  • Каковы варианты использования технологий повышения конфиденциальности в NSO?
  • Какие существуют три типа экосистем данных?
  • Какие три общих варианта использования предлагает Джек?
  • Что такое федеративное обучение и как оно работает?
  • Введение курирования данных в УВКБ ООН.
  • Как лучше показать данные?
  • Что такое умный шум? Как это работает?
  • Как данные были подготовлены для dataathon.
  • Трудности, с которыми столкнется каждый на хакатоне.
  • Как выглядит формула?
  • Как использовать SQL, чтобы делать более точные прогнозы.
  • Ведущие семинара: Лоренца Де Симоне из ФАО.
  • Спутниковые данные можно использовать для многих целей, в том числе для картирования неформальных поселений.
  • Каково применение данных ФАО?
  • Сколько изображений мы используем? Сколько временных композитов мы используем повторно? Это ежемесячная или двухмесячная компиляция?
  • Золотым стандартом для повышения максимально возможной точности является использование GPS для определения границ посылок.
  • Что происходит, когда у вас есть спутниковое изображение каждые 16 дней?
  • В чем разница между отдельными данными во временном ряду и данными временного ряда?
  • Какое значение имеют карты растительного покрова и типов сельскохозяйственных культур для интегрированной системы геопространственной информации?
  • Каковы источники карт земного покрова? Какие проблемы?
  • Каковы некоторые из основных ограничений текущих карт?
  • Как полевые данные используются для контролируемых и неконтролируемых подходов.
  • Как использовать кластеризацию K-средних для искусственной активации набора данных на месте.
  • Каковы преимущества этого решения?
  • Результаты исследования.
  • В чем разница между пиксельной и объектной моделями?
  • Возможно ли использовать спутниковые снимки для оценки растительного покрова, а также различных культур, которые у нас есть?
  • Что представляет собой программа «Цифровая Африка»?
  • Лоренцо дает нам представление о цифровой земле Африки на нескольких очень конкретных примерах.

День 4 (Комната А)

Программа сессии

  • Данные наблюдения Земли
  • Данные мобильного телефона

Ключевые слова

данные, съемка, участок, урожай, сельское хозяйство, оценки, сельскохозяйственные, границы, курсы, площадь, случай, обучение, малави, снимки, модель, данные наблюдения земли, спутник.

Контур

  • Представление сегодняшних спикеров.
  • Сегодняшняя тема: Роль, которую съемка может сыграть в калибровке и проверке световых методов для картографирования посевных площадей с высоким разрешением.
  • Спутники теперь могут наблюдать за сельскохозяйственными участками в мелких фермерских хозяйствах с такой четкостью, которую мы не могли себе представить всего несколько лет назад.
  • Каковы основные результаты этого исследования?
  • Данные опросов и машинное обучение для будущего.
  • Второе обследование в Малави является пятым комплексным обследованием домохозяйств, которое проводится параллельно с ИСПС, но требует немного большей продолжительности полевых работ.
  • Какие геопространственные предикторы мы используем?
  • Результаты этапов обучения и проверки.
  • Метод центроидов превосходит одноточечный метод.
  • Что дальше для исследования.
  • Глядя на чувствительность наших выводов в соответствии с разрешением спутниковых снимков.
  • Есть ли способ объединить картографические усилия со средствами для создания обучающих данных для спутников или изображений наблюдения Земли?
  • Может ли выпуск самостоятельно оценить доходность? Может быть независимым?
  • Ответственность за выполнение работы по сельскохозяйственной статистике не всегда лежит на НСР.
  • Создание учебных курсов по геопространственной информации на основе профилей пользователей.
  • Подход к обучению, используемый для разработки индивидуальной программы обучения.
  • Какие курсы будут задействованы?
  • До какого уровня знаний вы хотите подняться?

День 4 (Комната Б)

Программа сессии

  • Доступ к данным и машинное обучение
  • Машинное обучение

Ключевые слова

данные, официальная статистика, сайт, статистика, машинное обучение, бизнес, нидерланды, компании, интернет, бедность, модель, индикатор, организация, официальная статистика, региональный хаб, спутники.

Контур

  • Представляем ведущих.
  • Добро пожаловать на конференцию и чего ожидать.
  • Роль Google в исследовании и ее сравнение с традиционной статистикой.
  • Три категории интернет-экономики.
  • Онлайн-сервисы в центре внимания доклада.
  • Министерство экономики попросило нас что-то для них сделать.
  • Опрос Facebook «Covid».
  • Что за беспокойство, что мы потеряли данные за 100 лет?
  • Что вы можете сделать с полученными данными.
  • Как разные отрасли используют данные по-разному.
  • Пример того, как пандемия меняет поведение бизнеса в Интернете.
  • Любые данные лучше, чем отсутствие данных?
  • Проверка результатов данных.
  • Как мы поддерживаем фундаментальные принципы статистики, когда используем большие данные?
  • Как начать работу с сайтом.
  • Какие различные фильтры вы можете применить?
  • Какой способ оплаты является наиболее распространенным в бразильских интернет-магазинах?
  • Сколько бизнес-сайтов в Индонезии ссылаются на LinkedIn?
  • Сколько сайтов электронной коммерции было добавлено в Германии в 2022 году?
  • Что происходит со всей Южной Африкой под контролем?
  • Что машинное обучение и большие данные значат для вашей организации.
  • Каковы потенциальные варианты использования больших данных для официальной статистики?
  • Что вы уже сделали в партнерстве с ООН?
  • Что такое машинное обучение и как оно работает?
  • Зачем нужно машинное обучение для офисной статистики?
  • Какие инструменты доступны бесплатно для машинного обучения в национальных статистических службах?
  • Как мы можем получить больше доступа к данным?
  • Что значит машинное обучение для официальной статистики?
  • Можно ли ожидать таких же ограничений в государственном секторе, как и в частном?
  • Что сейчас является самой большой проблемой для сообщества машинного обучения?
  • Бедность в Индонезии и использование спутниковых снимков.
  • Как схема реализована в Индонезии.
  • Каковы плюсы и минусы использования спутниковых снимков для картирования бедности?
  • Что еще мы можем сделать с картой бедности?
  • Какие вопросы необходимо оценить?
  • Какова возможная межстрановая ошибка в данных?
  • Каковы компоненты платформы аналитики и прогнозов?
  • Как модель прогнозирования сравнивается с традиционной эконометрической моделью?
  • Что такое машинное обучение и как его можно реализовать в этой области?
  • Каковы ваши успехи в области науки о данных в Inquity?
  • Готовность НСО к внедрению больших данных, а также машинного обучения.

День 5 (Комната А)

Программа сессии

  • Данные мобильного телефона

Ключевые слова

данные, люди, mpd, телефонная компания, местоположение, мобильный телефон, региональный узел, страны.

Контур

  • Введение в сеанс.
  • Процесс течения в Нидерландах.
  • Второй шаг — проверка правильности результатов алгоритма.
  • Первая сетка размером 100 на 100 метров.
  • Есть ли возможность использовать местоположение сигнала GPS индивидуально, а не идти по местоположению телефона.
  • Как узнать, есть ли у вас правильные данные?
  • Каковы основные составляющие данных мобильной публикации MPD?
  • Как работает партнерство между BPS и Macell?
  • Вы в основном используете данные вышек сотовой связи или используете прозрачные прокси, которые используются для сжатия данных?
  • Предоставляете ли вы информацию о том, как вы выполняете очистку данных на основе вышек сотовой связи?
  • Какова роль регулирующих органов и министерств в этом отношении?
  • Как убедиться, что раскрытие данных не нанесет им вреда?
  • Как адаптироваться в партнерстве с операторами связи.
  • Каковы планы MPD в Бразилии?
  • Что происходит в МДП.
  • Некоторые НСО хотели бы поделиться своими опасениями или планами по использованию MPD.
  • Урок еще не закончился.
  • Итог семинара.

День 5 (Зал B и пленарное заседание)

Программа сессии

  • Машинное обучение
  • Заключительная сессия

Ключевые слова

данные, региональный хаб, модель, конференция, официальная статистика, картографирование, хакатон, участники, машинное обучение, глубокое обучение, дистанционное зондирование.

Контур

  • Введение к сегодняшнему занятию.
  • Второй выпуск курса «Машинное обучение для официальной статистики» скоро будет доступен для всех.
  • Глубокое обучение — это алгоритм управления данными.
  • Метод обнаружения облаков и теней.
  • Случай с картированием раннего подъема в Китае.
  • Как обнаружить облако и удалить облако со спутниковых снимков.
  • Важность тонкой настройки и передачи обучения в моделях дистанционного зондирования.
  • Какова цель этого обсуждения в малых группах?
  • Четыре идеи, которые у нас есть на данный момент.
  • Знакомство с остальным миром.
  • Что делать дальше?
  • Вступительное и заключительное слово от.
  • Важность актуальных и своевременных данных.
  • Спасибо всем, кто помог организовать этот хакатон.
  • Большие данные для официальной статистики.
  • Закрытие церемонии.

SDGCounting — это программа StartingUpGood, которая отслеживает ход подсчета и измерения успеха ЦУР. Следите за нами в Твиттере.