前言
sklearn是python的重要機(jī)器學(xué)習(xí)庫(kù),其中封裝了大量的機(jī)器學(xué)習(xí)算法,如:分類、回歸、降維以及聚類;還包含了監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、數(shù)據(jù)變換三大模塊。sklearn擁有完善的文檔,使得它具有了上手容易的優(yōu)勢(shì);并它內(nèi)置了大量的數(shù)據(jù)集,節(jié)省了獲取和整理數(shù)據(jù)集的時(shí)間。因而,使其成為了廣泛應(yīng)用的重要的機(jī)器學(xué)習(xí)庫(kù)。
sklearn是一個(gè)無(wú)論對(duì)于機(jī)器學(xué)習(xí)還是深度學(xué)習(xí)都必不可少的重要的庫(kù),里面包含了關(guān)于機(jī)器學(xué)習(xí)的幾乎所有需要的功能,因?yàn)閟klearn庫(kù)的內(nèi)容是如此之多以至于一開(kāi)始就從宏觀層面展開(kāi)的話很可能會(huì)使初學(xué)者感到困惑和恐懼。相反的,本文不會(huì)先整體介紹sklearn庫(kù),而是先從sklearn庫(kù)中的一些具體實(shí)例入手,在讀者學(xué)習(xí)完一些比較常用的函數(shù)并且對(duì)他們的功能有了一定了解之后,本文再?gòu)暮暧^展開(kāi),全面細(xì)致的講解sklearn庫(kù)。本博客中的實(shí)例幾乎都來(lái)自我自己學(xué)習(xí)keras的過(guò)程中,建議與我的另外一篇寫(xiě)keras的博客一同食用,理解起來(lái)更佳。
一、MinMaxScaler
MinMaxScaler函數(shù)主要的用途就在于數(shù)據(jù)歸一化。數(shù)據(jù)歸一化是在我們開(kāi)始深度學(xué)習(xí)之前做的數(shù)據(jù)預(yù)處理過(guò)程中的重要一環(huán),簡(jiǎn)單來(lái)說(shuō)就是將我們的測(cè)試樣本的元素都集中在[0,1]的區(qū)間上,數(shù)據(jù)歸一化可以讓我們的神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)起來(lái)更快達(dá)到最佳點(diǎn),如果不進(jìn)行歸一化的話神經(jīng)網(wǎng)絡(luò)可能會(huì)花費(fèi)很長(zhǎng)時(shí)間來(lái)收斂(也就是到達(dá)最佳點(diǎn))甚至可能最終也不會(huì)收斂。同時(shí),數(shù)據(jù)歸一化也可以大大增加神經(jīng)網(wǎng)絡(luò)中可學(xué)習(xí)參數(shù)的精度,從而達(dá)到更好的學(xué)習(xí)效果。下面就是MinMaxScaler函數(shù)的實(shí)例應(yīng)用。
from sklearn import preprocessing
import numpy as np
x = np.array([[3., -1., 2., 613.],
[2., 0., 0., 232],
[0., 1., -1., 113],
[1., 2., -3., 489]])
min_max_scaler = preprocessing.MinMaxScaler()
x_minmax = min_max_scaler.fit_transform(x)
print(x_minmax)
運(yùn)行結(jié)果:
[[1. 0. 1. 1. ]
[0.66666667 0.33333333 0.6 0.238 ]
[0. 0.66666667 0.4 0. ]
[0.33333333 1. 0. 0.752 ]]
總結(jié)起來(lái)就是兩步:1.scaler=preprocessing.MinMaxScaler()
2.x1=scaler.fit_transform(x)
x1就是歸一化之后的結(jié)果
注意,想要引入MinMaxScaler可以有兩種import的方式,除了上文中的方式還可以這樣做:
from sklearn.preprocessing import MinMaxScaler
到此這篇關(guān)于python庫(kù)sklearn常用操作的文章就介紹到這了,更多相關(guān)python庫(kù)sklearn內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python中的異常類型及處理方式示例詳解
- python實(shí)現(xiàn)郵箱發(fā)送信息
- Python Pytest裝飾器@pytest.mark.parametrize詳解
- python3 使用OpenCV計(jì)算滑塊拼圖驗(yàn)證碼缺口位置(場(chǎng)景示例)
- 詳解python關(guān)于多級(jí)包之間的引用問(wèn)題
- 一些讓Python代碼簡(jiǎn)潔的實(shí)用技巧總結(jié)
- 利用Python讀取微信朋友圈的多種方法總結(jié)
- Python使用psutil庫(kù)對(duì)系統(tǒng)數(shù)據(jù)進(jìn)行采集監(jiān)控的方法
- python編寫(xiě)adb截圖工具的實(shí)現(xiàn)源碼
- Python爬蟲(chóng)技術(shù)