Затягивание этих болтов: как использовать функцию np.where () в Python.

В библиотеках имеется множество функций, и их количество должно быть утомительным, но они - то, что делает / портит ваш алгоритм, они важны для вашего кода, как болты и гайки для двигателей; маленький, но важный, поэтому я написал эту статью для пошагового объяснения на примере массива и фрейма данных, чтобы объяснить, как использовать функцию np.where () из библиотеки numpy в python.

Меня это немного сбивало с толку, но после некоторых исследований и личного изучения я наконец понял это и хочу поделиться с вами. Есть два основных применения np. где функция (), о которой я расскажу здесь.

А. Получение индекса значений, удовлетворяющих определенному условию

Б. Замена значений другим значением в индексе, который удовлетворяет условию, при котором замена горит зеленым светом.

Итак, давайте посмотрим, как работает первая функция.

мы создаем массив после импорта необходимой библиотеки, применяем функцию where, чтобы мы могли получить позиции значений, которые удовлетворяют заданному условию. проверьте коды и попробуйте увидеть результат, который даст "позиция", чтобы полностью понять это

Итак, для второй функции мы импортируем наш файл .csv и превращаем его в фрейм данных с помощью pandas. Теперь у нас есть фрейм данных, исследуя столбцы, скажем, мы хотели бы изменить некоторые вещи в определенном столбце для условия.
Давайте проверим столбец «Возраст» в этом фрейме данных, и мы хотели бы сгруппировать возраст на два, скажем, жертвы в возрасте от 20 лет и младше и от 30 лет и старше. Поэтому мы сгруппировали его как «двадцатых годов вниз» и «тридцатых годов вверх».
Все, что нам нужно сделать, это использовать функцию np.where ().

df[‘age’] = np.where(df[‘age’]< 20, ‘Twenties downwards’, ‘Thirties upwards’)

df ['age'] первый член слева подразумевает столбец из набора данных, который необходимо изменить в соответствии с нашими предпочтениями. справа. < br /> у нас есть первый аргумент, df ['age'] ‹20, который является условием, которое необходимо выполнить. Второй аргумент, « Двадцать меньше »относится к замена любого индекса, в котором условие выполняется, а третий аргумент, «От тридцати лет назад» - это вариант else, т. е. когда данное условие не выполняется.
Итак, запустив этот код, мы увидим, как столбец возраста был заменен введенными нами терминами.

Попробуйте сами и дайте мне знать, что вы придумали. В Интернете есть много файлов .csv, и вы можете это попробовать.
Спасибо!