Edited at

Kaggle: ディープラーニングによる数値画像認識

More than 1 year has passed since last update.

Kaggleで「数字が書かれた画像を認識する」というテーマがあったのでやってみた。

https://www.kaggle.com/c/digit-recognizer


やること

訓練データのlabelには認識するべき数字が書かれている。他の属性はpixel0, pixel1のように、画像データのピクセルに対応している。pixelからlabelを推測できればOK。


コード


example.R

library("h2o")

h2oServer <- h2o.init(nthreads = -1)

train <- read.csv("train.csv", header=T)
test <- read.csv("test.csv", header=T)

train[,1] <- as.factor(train[,1])
train <- as.h2o(train)
test <- as.h2o(test)

model <- h2o.deeplearning(x = 2:1783, y = 1, training_frame = train,
activation = "Tanh", hidden=c(100,100))
y.pred <- h2o.predict(model, test)
y.df.pred <- as.data.frame(y.pred)
y.df.pred <- data.frame(ImageId = seq(1,length(y.df.pred$predict)), Label=y.df.pred$predict)

write.csv(y.df.pred, file = "submission.csv", row.names=F)

h2o.shutdown(prompt=F)



結果

Screenshot from 2017-07-04 16-02-52.png

0.96329という結果自体は悪くはない気がする。