Прогноз заработной платы, если многолетний опыт дается с использованием метода линейной регрессии

Описание задания

  1. Во-первых, мы должны настроить YUM в корневой операционной системе [в этом блоге RHEL8 находится поверх корневой операционной системы], чтобы загрузить и установить докер в корневой ОС.
  2. После настройки YUM мы установим Docker и запустим его в корневой ОС.
  3. Теперь у нас есть Docker, работающий поверх Root OS, на этом этапе нам нужно извлечь образ любой операционной системы, которую мы хотим запустить в Docker, а затем мы должны запустить/создать контейнер с извлеченным образом.
  4. Теперь нам нужно установить зависимости, необходимые для нашего проекта ML.
  5. Для обучения модели нам понадобится набор данных, поэтому мы загрузим его в ОС, работающую в Docker.
  6. Наконец, мы создадим модель и будем использовать ее для прогнозирования зарплат.

Конфигурация YUM в RHEL:

Когда мы устанавливаем RHEL8, мы получаем YUM по умолчанию, но чтобы он работал (установка или удаление и т. д. с помощью YUM), мы должны настроить YUM.

Файлы .repo используются для настройки YUM. И эти файлы находятся в каталоге «/etc/yum.repos.d/».

Вот файл .repo для настройки YUM для докера:

[docker]
baseurl=https://download.docker.com/linux/centos/7/x86_64/stable
gpgcheck=0
name=docker

Чтобы проверить, настроен ли этот конкретный файл или нет, используйте этот cmd:

ням реполист

Установите Docker:

Последовательность команд для установки и запуска Docker:

Чтобы установить Docker: yum install docker-ce — nobest -y

Для запуска Docker: systemctl start docker

Чтобы проверить доступные в настоящее время изображения: образы докеров

Извлечение образов любой ОС:

cmd для извлечения изображения: docker pull centos: последний

Создание контейнера из образа:

Чтобы создать контейнер: docker run -t — name container_name

Эта команда будет создавать новый контейнер каждый раз, но если мы хотим запустить существующий контейнер, нам нужно использовать команду:

docker run -it имя_контейнера/идентификатор_контейнера

Установка других зависимостей:

  1. ням установить python3
  2. pip3 установить панды
  3. pip3 установить numpy
  4. pip3 установить skicitlearn
  5. pip3 установить matplotlib

Управление набором данных:

у нас есть два варианта:

  1. wget (ссылка для скачивания набора данных)

Эта команда загрузит для нас набор данных в текущий каталог.

2. Мы можем сначала загрузить набор данных в корневую ОС, а затем скопировать в ОС докера. Сначала перейдите в каталог, в котором существует файл набора данных в корневой ОС, а затем выполните эту команду:

docker cp datasetfile_name Docker_OS_Id:/root

Эта команда скопирует файл набора данных в корневой каталог ОС Docker.

Код проекта:

импортировать панд как pd

импортировать sklearn

из sklearn.linear_model импортировать линейную регрессию

данные = pd.read_csv("/root/salary.csv")

x = данные["Годы опыта"].values.reshape(-1, 1)

у = данные["Зарплата"]

модель = линейная регрессия ()

модель.fit(х, у)

y_pred = модель.predict([[10]])

print("прогнозируемая зарплата")

печать (у_пред)

импортировать работу

joblib.dump(модель,”result.pkl”)

Спасибо