fetch_lfw_peopleのimport

In [1]:
from sklearn.datasets import fetch_lfw_people

データのダウンロード

  • downloadサイズは245 MB でした。
  • 時間はかかりますが、一度ダウンロードして保持しておけばその後は時間はかからない。
  • 最低100種類の写真があるデータをlfwにロードする(ローカルへのダウンロードはカラー画像含めて全てダウンロードされてます)
In [2]:
lfw = fetch_lfw_people(data_home='./scikit_learn_data/', min_faces_per_person=100)

colorの場合と基本は同じだが、グレースケールなので、dataとimagesの形式が異なる。

  • data :画像数は1140個。1画像は2914( 縦62×横47)
  • imges :画像形式の配列(各dataをreshape(62,47)した形態)
  • target :分類結果(dataを分類した場合の正解データになる値)
  • target_name : 分類結果(target)の値に対応する人物名(文字列)
In [3]:
lfw.data.shape
Out[3]:
(1140, 2914)
In [4]:
lfw.images.shape
Out[4]:
(1140, 62, 47)

最初の3画像を表示してみる

In [5]:
from matplotlib import pyplot as plt

plt.subplots_adjust(wspace=0.2, hspace=0.6)

for i in range(3):
    subplt = plt.subplot(1,3, i+1)
    subplt.imshow(lfw.images[i], cmap='gray')
    subplt.set_title(lfw.target_names[lfw.target[i]])
    
plt.show()