lupinus's diary

港区のデータサイエンティスト、縫物したり自転車に乗るのが好きな人の色んな記録を行う予定のブログ

Python | irisのデータセットについて

この記事に書いてあること

  • scikit-learnライブラリの中のirisのデータのまとめと簡単な使い方

はじめに

PythonはRと違ってデータの型?ごとに使えるメゾットが違うのでこんがらがってしまうので個人的にまとめてみました。

コードについて

# scikit-learnライブラリのデータセットを呼び込む準備
from sklearn import datasets

# irisのデータセットをirisに入れる
iris = datasets.load_iris()

print(iris.data)
#省略
#[[ 5.1  3.5  1.4  0.2]
#[ 4.9  3.   1.4  0.2]
#[ 4.7  3.2  1.3  0.2]
# [ 4.6  3.1  1.5  0.2]
# [ 5.   3.6  1.4  0.2]
# [ 5.4  3.9  1.7  0.4]
# [ 4.6  3.4  1.4  0.3]
# [ 5.   3.4  1.5  0.2]
# [ 4.4  2.9  1.4  0.2]
# [ 4.9  3.1  1.5  0.1]
# [ 5.4  3.7  1.5  0.2]
# ...

type(iris.data)
# numpy.ndarray

#irisの説明が出力される
print(iris.DESCR)

#特徴量のラベルを返してくれる
print(iris.feature_names)
#['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

#クラスラベルの習得
print(iris.target)
#[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]

#アヤメの名前
print(iris.target_names)
['setosa' 'versicolor' 'virginica']