«Без данных вы просто еще один человек, у которого есть мнение»

У. Эдвардс Деминг

Привет! Я Субхранил Сенгупта, студент-механик. В этом блоге я буду писать о том, как я хочу изучать машинное обучение, науку о данных и связанные с ними инструменты. Я изучаю машиностроение и мало знаком с информатикой, за исключением того, что посетил курс программирования на языке C и курс Программное обеспечение R от NPTEL (Национальная программа по расширенному обучению с использованием технологий). Цель состоит в том, чтобы изучить науку о данных и связанные с ней концепции с нуля, одновременно создавая сильные базовые знания по этим предметам.

Статистика

Наука о данных основана на концепциях статистики. Таким образом, статистику нельзя игнорировать, изучая науку о данных. Под статистикой я подразумеваю описательную статистику, а также статистику вывода. Статистика состоит из двух основных частей: Описательная статистика и Выводная статистика. Описательная статистика представляет собой краткую сводку данных. Мы можем резюмировать данные численно или графически. Выводная статистика использует случайную выборку данных, взятых из совокупности, для описания и вывода о населении.

Язык программирования

После изучения статистики пришло время изучить язык программирования. Я уже знаком с программным обеспечением R, которое широко используется в отрасли. Однако можно изучить python, java или java script, чтобы войти в отрасль. Я планирую выучить язык Python. Это объектно-ориентированный язык программирования, который можно использовать в науке о данных, машинном обучении и веб-разработке. Программное обеспечение Python и R, этих двух языков программирования достаточно, чтобы применять алгоритмы науки о данных, добывать и визуализировать данные.

База данных и SQL

База данных - это систематический сбор данных. База данных поддерживает хранение и обработку данных. Система управления базой данных (СУБД) - это набор программ, которые позволяют пользователю получать доступ к базе данных, манипулировать данными, представлять данные или составлять отчеты о данных. Это также помогает контролировать доступ к базе данных.

SQL (иногда произносится как See-Quel) означает язык структурированных запросов. Он используется для вставки, поиска, обновления и удаления данных из базы данных.

Это предметы, которые важно изучить, чтобы начать заниматься наукой о данных. Пожалуйста, хлопайте в ладоши и прокомментируйте ниже, если этот пост был вам полезен. Вы можете подписаться на меня, потому что я буду писать такие вещи каждые один или два дня (я постараюсь!). Спасибо за внимание.