Python | irisのデータセットについて
この記事に書いてあること
- scikit-learnライブラリの中のirisのデータのまとめと簡単な使い方
はじめに
PythonはRと違ってデータの型?ごとに使えるメゾットが違うのでこんがらがってしまうので個人的にまとめてみました。
コードについて
# scikit-learnライブラリのデータセットを呼び込む準備 from sklearn import datasets # irisのデータセットをirisに入れる iris = datasets.load_iris() print(iris.data) #省略 #[[ 5.1 3.5 1.4 0.2] #[ 4.9 3. 1.4 0.2] #[ 4.7 3.2 1.3 0.2] # [ 4.6 3.1 1.5 0.2] # [ 5. 3.6 1.4 0.2] # [ 5.4 3.9 1.7 0.4] # [ 4.6 3.4 1.4 0.3] # [ 5. 3.4 1.5 0.2] # [ 4.4 2.9 1.4 0.2] # [ 4.9 3.1 1.5 0.1] # [ 5.4 3.7 1.5 0.2] # ... type(iris.data) # numpy.ndarray #irisの説明が出力される print(iris.DESCR) #特徴量のラベルを返してくれる print(iris.feature_names) #['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)'] #クラスラベルの習得 print(iris.target) #[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2] #アヤメの名前 print(iris.target_names) ['setosa' 'versicolor' 'virginica']