Мы, люди, всегда учились на данных. Однако наблюдается сдвиг в доступности знаний. В настоящий момент знания повсюду как часть нашей повседневной жизни. Мы сталкиваемся с огромным количеством информации по самым разным темам, от жизни людей (близких или неизвестных) до новостей со всего мира и глубокого академического содержания. Использование алгоритмов сопоставления гарантирует, что ваш канал переполнен понравившимся контентом. Такое обилие информации вдохновило меня на обзор того, как мы храним и структурируем информацию в нашем мозгу.

Консолидация памяти в мозгу

Мы учимся, задействуя нейронные пути в нашем мозгу. Мы читаем / видим / слышим новую информацию и сохраняем ее в нашей кратковременной памяти. Консолидация памяти - это жизненно важный процесс для передачи информации из нашей краткосрочной памяти в долговременную. Чтобы улучшить наше понимание темы, мы связываем ее с существующими знаниями в нашем мозгу. Чем больше связей мы устанавливаем, тем глубже мы закрепляем знания в нашем мозгу и тем легче мы можем связать их с новыми концепциями в будущем.

Сфокусированный промежуток времени между людьми и компьютерами

Проблема с перегрузкой информации и обработкой информации в нашем мозгу - ограниченная продолжительность концентрации внимания. Мы можем сосредоточиться на интерпретации данных только в течение небольшого промежутка времени. Однако компьютеры могут обрабатывать числа и запускать алгоритмы в течение всего дня. Следовательно, связь между человеческой интерпретацией и вычислительными методами имеет решающее значение в нашем повседневном доступе к информации. Во-первых, нам нужны вычислительные мощности для преобразования больших объемов информации из беспорядочной, сложной в ясную и интерпретируемую. Затем мы можем взглянуть на корреляции и модели, чтобы понять основной процесс генерации данных. Это потенциально приводит к ценной информации о повседневных процессах.

Обобщение как база: консолидация данных

Когда мы начинаем проект по науке о данных, первым важным шагом является ознакомление с имеющимися данными. Что у нас есть? В чем его качество? Мы что-то упускаем? Есть еще много вопросов, которые нужно задать. Чтобы помочь с этим начальным процессом, мы используем методы обобщения данных. Их цель - объединить имеющиеся данные, чтобы их можно было интерпретировать. Чтобы интерпретировать вывод этих методов, нам нужно привыкнуть к терминологии. Проблема будет не в технических аспектах, так как программное обеспечение может быть создано для обработки статистических деталей. Однако мы не можем обойти необходимость понимания обществом терминологии, если мы хотим равноправного участия. Чтобы принять участие в инновациях, которые формируют наше общество, нам необходимо научить людей свободно говорить на языке Data Science.

Что нам нужно от человека

Вычислительная статистика может привести нас к расширению знаний, но нам нужно научиться интерпретировать ее результаты. Чтобы извлечь из этого пользу, нам необходимо объединить интерпретацию, выполненную человеком, с консолидированными результатами анализа. Углубленное знание основных процессов генерации данных приводит к улучшению процесса принятия решений отдельными лицами и организациями. Нам нужно, чтобы общество отбросило свои страхи и неуверенность в отношении будущего и начало его принимать. Хотя информация в Интернете может показаться сложной, любой может начать со своего уровня. Например, интерпретация среднего значения - это то, с чем мы уже привыкли. Как насчет того, чтобы распространить это на кластеры?

Человеческое понимание + вычислительная мощность = расширенные знания

В заключение я считаю, что нам нужно обучать людей, чтобы они чувствовали себя более комфортно с наукой о данных. В частности, после оптимизации соответствия модели или применения обучения без учителя люди должны быть оснащены для «чтения» этого нового способа представления знаний. Это оптимизирует возможности обнаружения при анализе данных.