"Рабочие часы"

Как написать отличную диссертацию по науке о данных

Несколько советов и уловок, которые помогут сделать вашу диссертацию максимально гладкой!

Наверное, существует более тысячи руководств о том, как написать отличную диссертацию (некоторые из моих любимых можно найти здесь, здесь и здесь). Они подчеркнут важность структуры, содержания и стиля. Они будут убеждать вас сначала записать вашу методологию и результаты, затем перейти к обзору литературы, введению и заключениям и написать резюме или реферат в последнюю очередь. Писать ясно и прямо, всегда учитывая ожидания читателя. Все эти советы очень ценны, но какие советы применимы к академическому письму в области науки о данных?

Студенты, изучающие науку о данных, происходят из самых разных областей и не обязательно являются опытными авторами технических статей. Итак, какие конкретные советы следует прочесть, прежде чем приступить к написанию отличной диссертации по науке о данных? Две недели назад я закончил магистерскую программу по науке о данных, и теперь чувствую себя экспертом в этой области. Большинство проблем, с которыми сталкивался я и мои сверстники, все еще свежи в моей памяти, и я хотел бы предложить здесь наиболее практические решения.

Выбор темы исследования

Решение и четкая формулировка инновационной, актуальной и управляемой исследовательской проблемы во многих случаях является самым сложным аспектом всего процесса. Возможно, вам нужно будет написать диссертацию для компании или исследовательской инициативы, где вы получите больше рекомендаций и указаний от своих руководителей. Или вам, возможно, придется самому придумать тему для исследования.

Во внешней организации

Написание диссертации в компании упрощает задачу выбора темы исследования, поскольку вас, скорее всего, заставят работать над определенной бизнес-проблемой или проблемой исследования. Однако здесь возникают некоторые другие проблемы, о которых вам следует знать. При работе в качестве специалиста по данным очень важно общение с заинтересованными сторонами, и написание диссертации в компании - ценный опыт в этом смысле. Очень важно, чтобы в начале проекта вы узнали о контексте, в котором работает компания, а также о том, какие проблемы они стремятся решить и чего от вас ждут. Следовательно, вы должны четко указать, что вы имеете в виду, что вы можете и что не можете делать и что вам нужно от организации для выполнения успешного исследовательского проекта.

Для себя

Написание диссертации без помощи сторонней организации также имеет свои преимущества и недостатки. С другой стороны, вы можете выбрать тему по своему вкусу. Если у вас есть особый интерес или страсть, исследование, связанное с этим, может дать вам импульс и сделать весь проект более приятным. Но что, если вы не имеете в виду какой-то конкретный предмет? Составить собственный план исследования может быть довольно сложно, но не волнуйтесь, к счастью, исследования машинного обучения обычно следуют определенной схеме. Учтите, что машинное обучение занимается прогнозированием или классификацией новых точек данных с использованием существующего набора данных. Таким образом, традиционные исследования в области машинного обучения выполняются с использованием различных методов машинного обучения для решения конкретной задачи (прогнозирование или классификация) и последующего сравнения их результатов с точки зрения точности, эффективности (использованное время и ресурсы) и применимости в контексте организации.

Дополнительные советы:

  • Не усложняйте задачу и выберите тему, по которой доступно достаточно данных.
  • Подумайте об интересных курсах и статьях, которые вы прочитали, или об исследованиях и карьерах, которыми вы хотели бы заниматься в будущем, и попытайтесь сформулировать академически значимую тему, которую вы сможете изучить в течение как минимум двух месяцев.
  • Постарайтесь сформулировать как минимум 3 убедительные темы исследования с сопутствующими вопросами исследования и обсудить со своими руководителями лучший и наиболее осуществимый вариант.
  • Подумайте о своих любимых методах, техниках и алгоритмах; Если вы увлечены нейронными сетями, то тема, по которой доступны лишь ограниченные объемы данных, может быть не самой умной.

Вдохновение:

Если вам не хватает вдохновения, беглый просмотр предыдущих тезисов может быть очень полезным. Это отличный способ познакомиться с академическими исследованиями в области науки о данных и машинного обучения, а также с их обычаями, соглашениями и передовыми методами. Просмотр прошлых диссертаций помог мне понять, как устроена типичная исследовательская работа по машинному обучению, и привел к многочисленным идеям об интересных статистических данных и визуализациях, которые я мог бы включить в свою диссертацию. Ниже я составил список отличных источников и баз данных, содержащих предыдущие тезисы.

Исследовательский процесс

Когда вы работаете над исследовательским проектом несколько месяцев подряд, у вас наверняка возникнет множество сомнений и вопросов, на которые вы не сразу найдете ответ. О том, как решать определенные проблемы, формулировать свои мысли или какие методы исследовать. Пожалуйста, для вашего собственного здоровья и душевного спокойствия не пытайтесь найти идеальное решение для каждой проблемы и не пытайтесь исследовать все возможные пути. Несовершенства неизбежны и в некотором смысле даже полезны. Если вас раздражает какая-то конкретная проблема, запишите ее! В конце концов, вы можете использовать этот список неприятностей, чтобы объяснить ограничения и предложения для будущих исследований в своем обсуждении. Запишите свои аргументы в пользу различных вариантов на каждом этапе процесса, чтобы вы могли их цитировать при написании мотивов для вашей методологии.

Несколько дополнительных советов:

  • Обычно рекомендуется практиковать открытую науку, публикуя свой код в Интернете. Отличный способ сделать это - использовать GitHub, где вы можете хранить свой код в репозитории. Старайтесь всегда аннотировать свой код, кроме того, вы можете более подробно объяснить свои решения с помощью readme. Чтобы узнать больше о GitHub, нажмите эту ссылку.
  • Наконец, спросите своего научного руководителя, можно ли записывать встречи. Поскольку именно они будут судить и оценивать вашу диссертацию, их советы особенно ценны, и если вы задали много вопросов, воспроизведение записей может быть очень полезным.

Написание всего

Наконец, вы завершили свое исследование, записали свои соображения и процедуры во время исследовательского проекта и готовы написать окончательную диссертацию. В конце концов, есть несколько практических советов, которые могут иметь большое значение в этой заключительной части процесса:

  • Если вам сложно сформулировать конкретное предложение или найти идеальное слово для описания чего-либо, просто поиск в Google или использование синонимов в тезаурусе всегда помогало мне вдохновить и сделать мое письмо плавным.
  • Найдите специалиста по LaTeX на Fiverr или Upwork, чтобы внести последние штрихи в вашу работу с точки зрения стиля и оформления. Это может значительно улучшить внешний вид вашей конечной работы относительно дешево и быстро.
  • То же самое и с орфографией и построением предложений. Особенно после работы над бумагой в течение нескольких месяцев подряд вы можете перестать замечать самые простые ошибки. Попросите друга или члена семьи помочь обнаружить ошибки и странно построенные предложения или найдите кого-нибудь на одной из вышеупомянутых платформ.
  • Прекрасный способ добавить вишенку на вершину - создать интерактивный пример вашего проекта. Это не осуществимо или полезно не для всех проектов, но если вы можете позволить пользователям взаимодействовать и экспериментировать с вашими моделями, это может действительно убедить людей в ценности вашего проекта на практике. Для этого загляните в такие библиотеки, как Dash, Streamlit или Shiny.