MCPcopy
hub / github.com/zalandoresearch/fashion-mnist

github.com/zalandoresearch/fashion-mnist @main sqlite

repository ↗ · DeepWiki ↗
38 symbols 154 edges 12 files 2 documented · 5%
README

Fashion-MNIST

GitHub stars Gitter Readme-EN Readme-CN License: MIT Year-In-Review

翻訳 : (株)クラスキャット セールスインフォメーション

目次

60,000 サンプルの訓練セットと 10,000 サンプルのテストセットから成る、Zalando の記事の画像のデータセットです。各サンプルは 28×28 グレースケール画像で、10 クラスからのラベルと関連付けられています。Fashion-MNIST は、機械学習アルゴリズムのベンチマークのためのオリジナルの MNIST データセット の 直接的な差し込み式の (= drop-in) 置き換え としてサーブすることを意図しています。

ここにどのようにデータが見えるかのサンプルがあります (各クラスは3行取ります) :

何故でしょう?

オリジナルの MNIST データセットは沢山の手書き数字を含みます。AI/ML/データサイエンス・コミュニティの人々はこのデータセットを好みそして彼らのアルゴリズムを検証するためのベンチマークとしてそれを使用します。実際に、MNIST はしばしば試してみる最初のデータセットです。「もしそれが MNIST で動作しなければ、まったく動作しないだろう」と彼らは言いました。「そうですね~、もし MNIST で動作するとしても、他の上では依然として失敗するかもしれませんが。」

Fashion-MNIST は、機械学習アルゴリズムのベンチマークのためのオリジナルの MNIST データセットの直接的な差し込み式の (= drop-in) 置き換えとしてサーブすることを意図しています、というのはそれは同じ画像サイズでそして訓練及びテスト分割の構造を共有しているからです。

真面目な機械学習研究者へ

真面目な話し、MNIST を置き換えることについて話しをしています。幾つかの良い理由がここにあります :

データを取得する

多くのMLライブラリには既にFashion-MNISTデータ/ APIが含まれています。試してみてください!

データセットをダウンロードするためには直接リンクを使用することができます。データはオリジナルの MNIST データと同じフォーマットでストアされています。

名前 内容 サンプル サイズ リンク MD5チェックサム
train-images-idx3-ubyte.gz 訓練セット画像 60,000 26 MBytes ダウンロード 8d4fb7e6c68d591d4c3dfef9ec88bf0d
train-labels-idx1-ubyte.gz 訓練セット・ラベル 60,000 29 KBytes ダウンロード 25c81989df183df01b3e8a0aad5dffbe
t10k-images-idx3-ubyte.gz テストセット画像 10,000 4.3 MBytes ダウンロード bef4ecab320f06d8554ea6380940ec79
t10k-labels-idx1-ubyte.gz テストセット・ラベル 10,000 5.1 KBytes ダウンロード bb300cfdad3c16e7a12a480ee83cd310

あるいはこのレポジトリを clone することもできます、データセットは data/fashion の下です。この repo はベンチーマークと可視化のための幾つかのスクリプトを含みます。

git clone git@github.com:zalandoresearch/fashion-mnist.git

ラベル

各訓練とテスト・サンプルは以下のラベル群の一つに割り当てられています :

ラベル 記述
0 T-shirt/top
1 Trouser
2 Pullover
3 Dress
4 Coat
5 Sandal
6 Shirt
7 Sneaker
8 Bag
9 Ankle boot

使い方

Python (NumPyが必要)でデータをロードする

この repo の utils/mnist_reader を使用する :

import mnist_reader
X_train, y_train = mnist_reader.load_mnist('data/fashion', kind='train')
X_test, y_test = mnist_reader.load_mnist('data/fashion', kind='t10k')

でデータをロードする

私たちのデータセットをダウンロードしてくださいことを確認し、それを data/fashionの下に置きます。それ以外の場合、* Tensorflowは自動的に元のMNISTをダウンロードして使用します。 *

from tensorflow.examples.tutorials.mnist import input_data
data = input_data.read_data_sets('data/fashion')

data.train.next_batch(BATCH_SIZE)

Fashion-MNISTを訓練するための高レベルのAPIであるtf.kerasの使用に関する公式のTensorflowチュートリアルがここにあります

他の機械学習ライブラリを使用する

今日まで、以下のライブラリは、組み込みデータセットとして Fashion-MNISTを含んでいます。 したがって、自分でFashion-MNISTをダウンロードする必要はありません。 そのAPIに従うだけで、あなたは準備が整いました。

他の言語でデータをロードする

機械学習コミュニティでもっとも人気のあるデータセットの一つですので、人々は多くの言語で MNIST loader を実装してきています。それらは Fashion-MNIST データセットをロードするためにも使用できるでしょう (最初に decompress する必要があるかもしれません)。それらは私たちによってテストはされていないことには注意してください。

ベンチマーク

scikit-learn ベースの自動ベンチマーキング・システムを構築しました、これは異なるパラメータの 129 の (深層学習ではない) 分類器をカバーします。 結果はここで見つかります。.

結果は benchmark/runner.py を実行することで再現できます。推奨方法はこの docker コンテナをビルドして deploy することです (訳注 : リンク欠落)。this Dockerfile.

貴方のベンチマークを submit することを歓迎します。新しい issue を作成してください、貴方の結果はここでリストされます。詳細は contributor guidelines セクションを確認してください。ベンチマークを submit する前に、このリストにリストされていなことを必ず確認してください。

分類器 前処理 Fashion テスト精度 MNIST テスト精度 Submitter コード
2 Conv+pooling None 0.876 - Kashif Rasul :link:
2 Conv+pooling None 0.916 - Tensorflow's doc :link:
2 Conv+pooling+ELU activation (PyTorch) None 0.903 - @AbhirajHinge :link:
2 Conv Normalization, random horizontal flip, random vertical flip, random translation, random rotation. 0.919 0.971 Kyriakos Efthymiadis :link:
2 Conv <100K parameters None 0.925 0.992 @hardmaru :link:
2 Conv ~113K parameters Normalization 0.922 0.993 Abel G. :link:
2 Conv+3 FC ~1.8M parameters Normalization 0.932 0.994 @Xfan1025 :link:
2 Conv+3 FC ~500K parameters Augmentation, batch normalization 0.934 0.994 @cmasch :link:
2 Conv+pooling+BN None 0.934 - @khanguyen1207 :link:
2 Conv+2 FC Random Horizontal Flips 0.939 - @ashmeet13 :link:
3 Conv+2 FC None 0.907 - @Cenk Bircanoğlu :link:
3 Conv+pooling+BN None 0.903 0.994 @meghanabhange :link:
3 Conv+pooling+2 FC+dropout None 0.926 - @Umberto Griffo :link:
3 Conv+BN+pooling None 0.921 0.992 @gchhablani :link:
5 Conv+BN+pooling None 0.931 - @Noumanmufc1 :link:
CNN with optional shortcuts, dense-like connectivity standardization+augmentation+random erasing 0.947 - @kennivich :link:
GRU+SVM None 0.888 0.965 @AFAgarap :link:
GRU+SVM with dropout None 0.897 0.988 @AFAgarap :link:
WRN40-4 8.9M params standard preprocessing (mean/std subtraction/division) and augmentation (random crops/horizontal flips) 0.967 - @ajbrock :link: :link:
DenseNet-BC 768K params standard preprocessing (mean/std subtraction/division) and augmentation (random crops/horizontal flips) 0.954 - @ajbrock :link: :link:
MobileNet augmentation (horizontal flips) 0.950 - @苏剑林 :link:
ResNet18 Normalization, random horizontal flip, random vertical flip, random translation, random rotation. 0.949 0.979 Kyriakos Efthymiadis :link:
GoogleNet with cross-entropy loss None 0.937 - @Cenk Bircanoğlu :link:
AlexNet with Triplet loss None 0.899 - @Cenk Bircanoğlu :link:
SqueezeNet with cyclical learning rate 200 epochs None 0.900 - @snakers4 :link:
Dual path network with wide resnet 28-10 standard preprocessing (mean/std subtraction/division) and augmentation (random crops/horizontal flips) 0.957 - @Queequeg :link:
MLP 256-128-100 None 0.8833 - @heitorrapela :link:
VGG16 26M parameters None 0.935 - @QuantumLiu :link: :link:
WRN-28-10 standard preprocessing (mean/std subtraction/division) and augmentation (random crops/horizontal flips) 0.959 - @zhunzhong07 :link:
WRN-28-10 + Random Erasing standard preprocessing (mean/std subtraction/division) and augmentation (random crops/horizontal flips) 0.963 - @zhunzhong07 :link:
Human Performance Crowd-sourced evaluation of human (with no fashion expertise) performance. 1000 randomly sampled test images, 3 labels per image, majority labelling. 0.835 - Leo

Core symbols most depended-on inside this repo

start
called by 4
benchmark/runner.py
touch
called by 2
configs.py
parse_arg
called by 2
utils/argparser.py
now_int
called by 2
utils/helper.py
loadResult
called by 2
static/js/vue-binding.js
run
called by 2
benchmark/runner.py
touch_dir
called by 1
configs.py
_get_logger
called by 1
configs.py

Shape

Function 19
Method 15
Class 4

Languages

Python95%
TypeScript5%

Modules by API surface

benchmark/runner.py16 symbols
utils/helper.py9 symbols
configs.py4 symbols
utils/argparser.py3 symbols
static/js/vue-binding.js2 symbols
benchmark/convnet.py2 symbols
utils/mnist_reader.py1 symbols
app.py1 symbols

Dependencies from manifests, versioned

psutil5.2.2 · 1×
scikit-learn0.19.0 · 1×

For agents

$ claude mcp add fashion-mnist \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact