Я пытаюсь заполнить данные NaN соответствующими данными на основе наблюдаемых отношений между двумя категориальными данными в кросс-таблице.
До сих пор я научился заменять его по этой формуле:
train.loc[train.Outlet_Type =='Grocery Store','Outlet_Size']='Small'
но что, если я хочу заменить значения NaN на 3 разных значения вместо одного (например, «маленький», «Средний», «Высокий») пропорционально на основе доли каждого значения в приведенной выше кросс-таблице для «Супермаркет Type1».
Я был бы признателен, если бы вы могли дать мне совет по этому вопросу.