Я думаю, мы все согласны с тем, что Scikit-learn - это основная библиотека машинного обучения для Python. На самом деле это библиотека, удобная для новичков, благодаря семантическому интерфейсу (API). По этой причине многие люди до сих пор используют и вносят свой вклад в библиотеку Scikit-Learn.

Библиотека Scikit-Learn очень хорошо разработана с использованием метода ООП (объектно-ориентированного программирования) Python. Ознакомьтесь с классами здесь.

Кстати, такого класса нет, но алгоритм контролируемого обучения может иметь такую ​​структуру:

Так что же такое оценщик? А как насчет методов fit (), предсказать () и score ()? Давай проверим.

Библиотека Scikit learn имеет три основных интерфейса (API):

Оценщики: основной и основной интерфейс Scikit-learn. Вкратце, мы говорим, что оценщики - это классы, которые могут изучать и оценивать некоторые параметры данных с помощью метода fit (). Все гиперпараметры оценщика доступны напрямую через общедоступные переменные экземпляра. Например, алгоритм случайного леса - это оценка.

estimator = estimator.fit(data, targets) #supervised learning
or
estimator = estimator.fit(data) #unsupervised learning

Преобразователи. Оценщики, которые также могут преобразовывать данные с помощью методов transform () или fit_transform (), называются преобразователями.

new_data = transformer.transform(data)
new_data = transformer.fit_transform(data) 
#fit_transform method is much faster than doing fit() and transform() in order. 

Предикторы. Некоторые оценщики также могут предсказать значение. Например, мы можем прогнозировать количества с помощью окончательной модели регрессии, вызывая функции pred () и score () в окончательной модели.

prediction = predictor.predict(data)
probability = predictor.predict_proba(data)
score = model.score(data)

Класс SimpleImputer из библиотеки sklearn обычно используется для обработки пропущенных значений. Это оценщик, а также пример трансформатора.

Вот схема контролируемого обучения, составленная мной. Обратите внимание, что метод fit () принимает здесь два параметра.

В чем разница между оценщиком и предиктором?

Несмотря на то, что предиктор также является оценщиком, между ними есть небольшая разница. Оценщики изучают данные поезда и оценивают некоторые параметры с помощью метода fit () или fit_transform (), в то время как Предикторы делают прогноз на основе невидимых данных (которые - тестовые данные) для прогнозирования значения с помощью метода pred ().

Спасибо за внимание. Пожалуйста, дайте мне знать, если у вас есть отзыв.

Ссылки:



Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow