На африканский континент приходится четверть всей земли, и большинство людей, не считая рабочей силы, заняты в сельскохозяйственном секторе. И только 4% земель орошаются, что серьезно сказывается на производительности сельского хозяйства, в результате чего треть населения страдает от недоедания.

Проблема

По оценкам Сельской сети водоснабжения, за 20-летний период в Африке к югу от Сахары ежегодно устанавливалось около 60 000 ручных насосов, причем до 40% из них в регионе не функционировали. Большинство ручных насосов производятся в Индии с плохим контролем качества и переработанными деталями. Наряду с неточным размещением скважин для добычи подземных вод и нехваткой квалифицированной рабочей силы для размещения и обслуживания. Вы можете понять, почему так много насосов вышли из строя.

Набор данных

Данные были использованы в рамках конкурса Driven Data Challenge, который включает более 60 000 наблюдений и 42 функции.

Модель

Задача состоит в том, чтобы мы спрогнозировали требования к техническому обслуживанию для каждого насоса. Для этой задачи я использовал логистическую регрессию. Логистическая регрессия использует уравнение в качестве представления, в котором входные значения линейно комбинируются с использованием весов или значений коэффициентов для прогнозирования выходного значения, такого как значение мультикласса. Логистическая регрессия также предоставляет коэффициенты для определения влияния каждой функции на классификацию каждого класса. Окончательная оценка точности, которую я представил, составила 0,72210.

Решение

Теперь, когда мы сделали прогнозы на основе данных. Таарифа и Министерство водных ресурсов Танзании могут решить проблемы каждого насоса и решить растущую проблему в Африке.