Конечно, вот отсортированная стенограмма:

Я собираюсь рассказать вам, ребята, как начать работу с машинным обучением. Я постоянно слышу эти вопросы от начинающих или программистов среднего уровня, которые спрашивают меня, с чего им начать и что им нужно сделать, чтобы заняться машинным обучением и искусственным интеллектом. Итак, в этом видео я собираюсь рассказать вам, в первую очередь, какой язык вы должны использовать/изучать, какая математическая подготовка вам нужна, а затем какому процессу вы должны следовать с точки зрения того, что вы должны учитесь сначала и куда вам следует двигаться дальше, чтобы становиться все лучше и лучше с машинным обучением на начальном уровне.

Первое и, вероятно, самое важное, о чем здесь следует поговорить, — это язык, который вы должны использовать для машинного обучения, будучи новичком, который только начинает. Теперь существует множество языков, разработанных специально для машинного обучения, таких как R и некоторые другие языки, которые я не могу придумать навскидку, и вы даже можете сделать это в таких вещах, как JavaScript и Java и все такое. Другие языки. Вы можете заниматься машинным обучением и искусственным интеллектом на этих языках, но язык, который я порекомендую, — это Python. Причина, по которой я говорю это, заключается в том, что это своего рода отраслевой стандарт для машинного обучения и искусственного интеллекта, и если вы получите работу в этой области, скорее всего, вы будете использовать Python для выполнения большей части своей работы. Это здорово, потому что вы можете использовать его не только для машинного обучения, но и для многих других задач, и, вероятно, это один из самых простых языков для начинающих. Вот почему я рекомендую Python. Он также имеет наибольшее количество модулей и поддерживает машинное обучение и искусственный интеллект, и если вы ищете учебные пособия и пытаетесь научиться этому, вы найдете наибольшую поддержку и ресурсы на языке Python. Поэтому я рекомендую начать с Python. По мере того, как вы становитесь более продвинутым, вы можете переходить на более конкретные языки, но Python отлично подходит для начала.

Теперь следующее, о чем стоит поговорить, это математика. Я знаю, что это отпугивает многих людей, потому что они всегда говорят: «Я не очень силен в математике. Могу ли я начать работу с машинным обучением?» Я знаю, что машинное обучение — это много математики. Нужно ли мне знать математику, чтобы это сделать? Ответ на этот вопрос - нет. Вам не нужно хорошо разбираться в математике, чтобы заниматься машинным обучением. Но если да, то это очень поможет вам. Теперь позвольте мне объяснить это. Вы можете пройти и пройти любой учебник по машинному обучению, и вы даже, вероятно, можете получить работу, не понимая, как работает большая часть математики для машинного обучения, и вы можете использовать ее нормально. Вы можете делать прогнозы, вы можете создавать приложения, вы можете делать крутые вещи. Но если вы понимаете, как работает математика, все становится намного проще и понятнее. В конце концов, машинное обучение — это не просто черный ящик, куда что-то приходит и что-то выходит. Это очень сложный математический алгоритм, написанный профессорами и экспертами по математике, и все, что вам нужно сделать, это использовать эту математику, которая уже была создана для вас, чтобы получить желаемый результат. Поэтому, если вы сможете понять, почему это работает и почему все происходит так, а не иначе, вы сможете стать намного лучше и иметь более четкое представление обо всех этих вещах.

Теперь, когда мы выбрали язык и понимаем, сколько математики нам нужно знать для машинного обучения или, может быть, сколько математики мы не знаем для машинного обучения, я просто проведу вас через этапы машинного обучения. обучение. Причина, по которой я это делаю, заключается в том, что многие люди, которые этим занимаются, не понимают, что на самом деле связано с ИИ, машинным обучением. Они видят классное видео какого-то парня, который сделал классный проект по машинному обучению, создал классного робота с искусственным интеллектом, что бы это ни было, и хотят начать. Но позвольте мне просто рассказать вам, что на самом деле происходит, потому что вы можете быстро понять, что, возможно, это не совсем то, что вы хотите делать, или это немного отличается от того, что вы думали.

Первым шагом в любом проекте машинного обучения является анализ проблемы или того, что вы хотите сделать. Выяснить, что моя модель машинного обучения собирается сделать для меня? Будет ли он что-то предсказывать? Будет ли что-то создаваться? Будет ли он рекомендовать информацию? Что он собирается делать? Понимание проблемы важно, и именно так вы выберете алгоритм, который собираетесь использовать. После того, как вы это сделаете, пришло время для сбора данных. Какие данные мы собираемся использовать для этого алгоритма машинного обучения? Мы знаем, что с машинным обучением, искусственным интеллектом нам нужна тонна данных, например, иногда вы можете использовать терабайты данных для обучения модели. Итак, какие данные нам нужны и откуда мы их получим? После этого нам нужно очистить данные. И не все наши данные получаются красивыми и четкими, как мы можем видеть в некоторых наборах данных. Нам нужно очистить это, нам нужно выбрать то, что мы на самом деле хотим, и это подводит нас к следующему шагу — выбору данных. У нас есть тонны данных, но все ли они имеют отношение к нашей проблеме? Относится ли все это к тому, что мы хотим сделать? Обычно нет. Итак, теперь вы знаете, что мы собираем данные, мы выбираем то, что мы хотим, и мы должны выбрать важные вещи, которые мы действительно собираемся использовать в нашей модели. Теперь, после того, как мы это сделали, что мы делаем? Мы должны выбрать, какую модель мы собираемся использовать, какой алгоритм мы собираемся использовать, как мы на самом деле собираемся решать эту проблему с помощью машинного обучения или искусственного интеллекта.

Теперь, когда мы выбрали, какую модель будем использовать, нам нужно обучить эту модель. Итак, введите все эти данные. И после этого нам нужно проверить модель. Нам нужно проверить его точность. Нам нужно посмотреть, имело ли это на самом деле смысл и дало ли это что-то. И тогда нам нужно продолжать делать это снова. Нам нужно продолжать настраивать модель и делать ее все лучше и лучше, пока она не станет лучше. Так что обратите внимание, что в этом фактическая часть машинного обучения, такая как запуск алгоритма, обучение и тестирование модели, не является основной частью этого. Основная часть этого — выбор алгоритма, который мы собираемся использовать, и выбор правильных данных, а это огромная часть работы.