Введение в машинное обучение и статистическое моделирование.

#QOTD: «Мы можем видеть только небольшое расстояние вперед, но мы видим там много того, что нужно сделать», — Алан Тьюринг (математик, отец компьютерных наук и искусственного интеллекта).

Технологии для нетехнологов!

Будучи выпускником факультета математики и информатики, я заметил два элемента, которые повлияли на то, как я представляю, понимаю, создаю и представляю вещи в уме. Проверь их:

  1. жизненные события можно объяснить большинство событий и явлений с помощью ненасытной силы математики,
  2. Язык математики не прост для изучения и понимания.

Ради моего личного роста в этом вопросе мне пришлось найти творческие способы объяснить сначала себе, а затем другим эти математические понятия доступным языком, используя простой и понятный язык. примеры из реальной жизни, которые я мог бы коснуться.

Теория мяча для гольфа — это теория интуитивного подхода, направленная на то, чтобы познакомить человека, не являющегося техническим специалистом, с высоким уровнем и четким пониманием процессов машинного обучения с намеком на статистическое моделирование.

К концу этой статьи вы будете критически планировать свои эксперименты. Предположим, вы хотите расширить свои знания. В этом случае я советую вам узнать о некоторых наиболее часто используемых алгоритмах машинного обучения, таких как полиномиальная регрессия, дерево решений (регрессия или классификация) или логистическая регрессия. Этого более чем достаточно для начала, поверьте мне.

Итак, теория мячей для гольфа.

Вы, мой друг, теперь должны встать на место игрока в гольф, но не любого игрока в гольф. Мы, безусловно, могли бы использовать Тайгера Вудса, одного из самых известных игроков в гольф всех времен. Поздравляем вас!

Давайте представим… мы на турнире, и сейчас ваша очередь играть. Вы должны бросить качели, чтобы ударить по мячу наилучшим образом, чтобы он попал в лунку с легким ударом. Конечно, как профессиональный игрок, вы знаете правила. Но, кроме того, вы также учитываете некоторые переменные, которые могут повлиять на окончательный результат обращения.

А теперь представьте… вы готовитесь ударить по мячу, день солнечный, ветер слабый, птички щебечут, за вами наблюдает толпа, в том числе самые неравнодушные люди, у вас есть все клубы, которые вы нужно, ты сделал все маленькие суеверные хитрости, которые ты всегда делаешь перед тем, как ударить по мячу.

Однако, прежде чем сделать это, вы, как обычно, делаете короткую оценку… и начинаете задавать себе ряд вопросов, начиная с наиболее предсказуемых и заканчивая наименее предсказуемыми:

  • Какую клюшку для гольфа мне следует использовать?
  • Как погода? Идет дождь?
  • Сколько человек в толпе? Все смотрят?
  • Каково направление ветра? Слишком сильный ветер?
  • Как сильно я должен ударить по мячу?
  • Как далеко отверстие?
  • и так далее…

Вы понимаете, что некоторые переменные помогают вам «узнать» (предсказать) результат попадания. Итак, вы начинаете обращать внимание на важные из них: направление ветра, клюшку для гольфа, которую вы будете использовать, силу удара по мячу и, возможно, еще пару вещей, но, в конце концов, вы учитываете лишь некоторые из них.

Поздравляем, теперь вы консолидировали свой набор данных и выполнили уменьшение размерности, что часто является одним из первых шагов прогнозирования машинного обучения. Рассматривая переменные, которые могут повлиять на окончательный результат попадания, вы собираете информацию или данные. Кроме того, рассматривая только самые важные переменные, вы перешли от числа переменных X к числу переменных X-n. Другими словами, у вас меньше переменных для просмотра, но более качественный набор данных.

Продолжим знакомство с #ML. Если вы добрались до этой строки, вы сделали хорошо. Но, лучшее еще впереди, чтобы продолжать !!

Мыслить объективно

Еще одна мысль перед ударом по мячу:

«Какая техника будет наиболее подходящей для этого удара, используя эту конкретную клюшку на указанном расстоянии в солнечный день?»

Теперь вы начинаете представлять результаты каждого возможного удара с учетом основных переменных (погодные условия, расстояние, тип клюшки и сила удара).

Итак, вы придумали список, который может выглядеть так, давайте предположим:

  • Если ваша левая рука слишком высока, будучи правшой, вы можете в конечном итоге приложить слишком много или недостаточно силы к своему замаху.
  • Если вы не будете следить за определенным местом поля, вы можете ударить по мячу не в том месте.
  • Если ваша талия не двигается правильно вместе с остальным телом, вы можете изменить свою силу или ударить по мячу в неправильном направлении.
  • и конечно больше…

Вы идете вперед принять удар! Все условия соблюдены, чтобы забить, но, к сожалению, попадаешь в траву, и мяч падает прямо в воду метрах в 20 от лунки… Какая беда. Но вы еще не закончили!

Помните, вы профессиональный игрок, вы занимаетесь этим много лет, у вас есть часы практики на часах, вы также очень хорошо знаете свое оборудование и учитесь справляться с различными погодными условиями. Следовательно, вы больше концентрируетесь, меняете положение и пробуете снова.

У вас есть все это под CRTL. Так что ударь по мячу еще раз и бац! На этот раз прямо в дыру, как ты и оценил! Ура, лучше, чем Тайгер Вудс, у нас есть Вудс «place_your_name» :)

Поздравляю еще раз! Вы дошли до конца теории мяча для гольфа. Прочитав это, вы вычислили несколько важных шагов. Во-первых, вы выбрали свою модель, выбрав определенное положение тела. Во-вторых, вы сделали некоторые прогнозы, делая предположения об окончательном результате попадания. В-третьих, вы настроили свою модель, изменив положение тела и немного сфокусировавшись перед вторым ударом. Затем вы сравнили свои прогнозы с фактическими данными. Наконец, вы оценили посадку вашей модели, взглянув на то, как далеко в воде приземлился мяч.

Это была, как было представлено, очень интуитивная теория вводного подхода к машинному обучению и статистическому моделированию. Прелесть этой теории в том, что если вы используете прямолинейный и реальный подход, вы можете смоделировать практически любую проблему и объяснить ее более или менее кому угодно.

Я искренне верю, что большинство статистических моделей, используемых в машинном обучении, представляют собой сконструированные мысли, объясненные на универсальном математическом языке. Другими словами, если вы «критически мыслите», возможно, вы уже используете некоторые из этих алгоритмов в своей голове под разными именами и определениями.

Дайте мне знать, если вы что-то поняли, оценили прочитанное и хотите оставить отзыв! Je suis preneur :)

И да, ты можешь надеть зеленую куртку своего Учителя, мой друг.

поймайте меня в Twitter, LinkedIn или по электронной почте: [email protected] #AiForEveryone