Прогноз заработной платы, если многолетний опыт дается с использованием метода линейной регрессии
Описание задания
- Во-первых, мы должны настроить YUM в корневой операционной системе [в этом блоге RHEL8 находится поверх корневой операционной системы], чтобы загрузить и установить докер в корневой ОС.
- После настройки YUM мы установим Docker и запустим его в корневой ОС.
- Теперь у нас есть Docker, работающий поверх Root OS, на этом этапе нам нужно извлечь образ любой операционной системы, которую мы хотим запустить в Docker, а затем мы должны запустить/создать контейнер с извлеченным образом.
- Теперь нам нужно установить зависимости, необходимые для нашего проекта ML.
- Для обучения модели нам понадобится набор данных, поэтому мы загрузим его в ОС, работающую в Docker.
- Наконец, мы создадим модель и будем использовать ее для прогнозирования зарплат.
Конфигурация YUM в RHEL:
Когда мы устанавливаем RHEL8, мы получаем YUM по умолчанию, но чтобы он работал (установка или удаление и т. д. с помощью YUM), мы должны настроить YUM.
Файлы .repo используются для настройки YUM. И эти файлы находятся в каталоге «/etc/yum.repos.d/».
Вот файл .repo для настройки YUM для докера:
[docker]
baseurl=https://download.docker.com/linux/centos/7/x86_64/stable
gpgcheck=0
name=docker
Чтобы проверить, настроен ли этот конкретный файл или нет, используйте этот cmd:
ням реполист
Установите Docker:
Последовательность команд для установки и запуска Docker:
Чтобы установить Docker: yum install docker-ce — nobest -y
Для запуска Docker: systemctl start docker
Чтобы проверить доступные в настоящее время изображения: образы докеров
Извлечение образов любой ОС:
cmd для извлечения изображения: docker pull centos: последний
Создание контейнера из образа:
Чтобы создать контейнер: docker run -t — name container_name
Эта команда будет создавать новый контейнер каждый раз, но если мы хотим запустить существующий контейнер, нам нужно использовать команду:
docker run -it имя_контейнера/идентификатор_контейнера
Установка других зависимостей:
- ням установить python3
- pip3 установить панды
- pip3 установить numpy
- pip3 установить skicitlearn
- pip3 установить matplotlib
Управление набором данных:
у нас есть два варианта:
- wget (ссылка для скачивания набора данных)
Эта команда загрузит для нас набор данных в текущий каталог.
2. Мы можем сначала загрузить набор данных в корневую ОС, а затем скопировать в ОС докера. Сначала перейдите в каталог, в котором существует файл набора данных в корневой ОС, а затем выполните эту команду:
docker cp datasetfile_name Docker_OS_Id:/root
Эта команда скопирует файл набора данных в корневой каталог ОС Docker.
Код проекта:
импортировать панд как pd
импортировать sklearn
из sklearn.linear_model импортировать линейную регрессию
данные = pd.read_csv("/root/salary.csv")
x = данные["Годы опыта"].values.reshape(-1, 1)
у = данные["Зарплата"]
модель = линейная регрессия ()
модель.fit(х, у)
y_pred = модель.predict([[10]])
print("прогнозируемая зарплата")
печать (у_пред)
импортировать работу
joblib.dump(модель,”result.pkl”)
Спасибо