Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
Help us understand the problem. What is going on with this article?

R(データマイニング入門) Windows 6段階。データ取得・導入・起動・スクリプト読み込み・一括実行・逐次実行。3つの罠。

More than 1 year has passed since last update.

データマイニング入門, 豊田 秀樹, 東京図書(2008/12/05)

https://www.amazon.co.jp/dp/product/4489020457/
第1章を Windows でデータ取得・導入・起動・実行・描画・一括実行。

Raspberry PI, Macintosh, Mac上のdocker/ubuntuでのデータ取得・導入・起動・実行などはこちら
https://qiita.com/kaizen_nagoya/items/e8417310129c2425af59

「データマイニング入門 第9章「潜在意味解析」が本のように動かない件。壁3つ。Macintoshはコードの壁も。」第9章がまだうまく再現できていないという記事はこちら。
https://qiita.com/kaizen_nagoya/items/44567fb589c040aad40d

1. データ取得

東京図書から落とす(Download)
http://www.tokyo-tosho.co.jp/books/978-4-489-02045-2/DL02045_2017.zip

file1.png

落としただけだと、Rからはみえない。
ダウンロードフォルダを表示して、DL02045_2017を選択して、マウスの右ボタンを押し、「すべて展開」を選ぶ。

罠1 展開しなくてもフォルダの中身が見える

Windowsでは、zipファイルを展開しなくても、フォルダの中身がわかります。
そこで、すべてを展開するのをわすれて、スクリプトを読み込もうとすると、そんなファイルは見当たらない。

2. 導入

はじめてのときは、
https://cran.r-project.org/bin/windows/base/R-3.4.3-win.exe

実行すると

R1.png

R2.png
R3.png
なんだ、じゃ、日本語選ぶ前にだしてよ。

3.起動

Windowsメニューを選ぶと、
icon.png
Rx64 3.4.3のアイコンが現れている。Windows 64bitならこちらをダブルクリック。32bitならRi386 3.4.3をダブルクリック。

rconsole.png
Rのコンソール画面が現れる。

4. スクリプト読み込み

導入時は、導入ユーザのDocumentが作業ディレクトリになっている。

4.1 作業フォルダの変更

fold1.png
RGui(64bit)の「ファイル」メニューを開いて、「作業スペースの読み込み」を選択する。

fold2.png

「DL02045_2017」の「Program」の「chap1」を選択したら「OK」

4.2 スクリプトの読み込み

script1a.png

「ファイル」メニューで、「スクリプトをひらく」を選択し、「ファイル名」の右の方の「R files(.R)」を「All files(.*)」に変更し、「陸上データ... テキストファイル」を選択して「開く(O)」

Reditor.png

Rエディタが起動する。

罠2 命令(script)ファイルの拡張子はR

命令(script)ファイルの拡張子はR。拡張子がtxtだと、一瞬、スクリプトだと思って貰えない。
「All files(.)」に変更すれば、txtファイルもScrip

4.3 参考 txtファイルをRファイルに変更

もし、txtじゃいやで、Rファイルにしたければ、
コマンドプロンプトを起動

Microsoft Windows [Version 10.0.14393]
(c) 2016 Microsoft Corporation. All rights reserved.

C:\Users\Administrator>cd Downloads

C:\Users\Administrator\Downloads>cd DL02045_2017

C:\Users\Administrator\Downloads\DL02045_2017>cd Program

C:\Users\Administrator\Downloads\DL02045_2017\Program>cd chap1

C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1>DIR

C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1 のディレクトリ

2018/01/23  11:07    <DIR>          .
2018/01/23  11:07    <DIR>          ..
2018/01/23  11:05               339 陸上データ.csv
2018/01/23  11:05               245 陸上データ.txt
               2 個のファイル                 584 バイト
               2 個のディレクトリ  74,728,464,384 バイトの空き領域

C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1>COPY *.TXT *.R
陸上データ.txt
        1 個のファイルをコピーしました。

5 一括実行

Run.png

「編集」メニューで、「全て実行」を選択すると、一括実行する。
result.png

ただし、plotとhistは画像出力をする先が同じだと、plotの結果が画面に残らない。

図の保存方法

図を選択して「ファイル」メニューの「別名で保存」の「Jpeg」「Png」などその後の作業に便利な種類(大きさも考慮)をえらびぶ。ディスクに空きがあれば、「100%の品質」で保存。100%の品質でファイルがおおきければ、75%, 50%を後から選べば良い。

罠3 出力先の既定値は一つ

描画機能は、出力先を別に指定しないと一つの場所に描こうとする。plot, histとつづけて描くと先の絵は消える。
chap2で、plotで連続して2つ描いたら、別々の出力が出た。plotとhistの関係を要調査。

6 逐次実行

run2.png

1行づつ実行するには、Rコンソールにコマンド(script)をコピペしてリターンしてもよい。
また、Rエディタの実行したい行を選んで、「カーソル行または選択中のRコードを実行」

result2.png

なんとか1章を実行できました。

困ったこと、まようこと

困り1 UTF-8以外のデータ

困り2 図を上がきする

chap1
chap3

chap2は別々にでる。(Windows)

困り3 packageが未導入

  1. options(CRAN="http://cran.md.tsukuba.ac.jp/")

install.packages("xxx", dep=T) # 依存関係を考慮しつつ(dep=T)

chap2
install.packages文なし

chap3
install..packages文あり
install.packages("rpart")
install.packages("rpart.plot")
install.packages("partykit")

chap4
animal1.txt
install.packages("som") #20180124 Dr.Kiyoshi Ogawa add
library(som)

cocktail.txt
install.packages("kohonen")
library(kohonen)

chap5
animal2.txt
install.packages("arules")
library(arules)

chap8
お札.txt
install.packages("e1071")
install.packages("scatterplot3d")

chap9

install.packages("RMeCab", repos = "http://rmecab.jp/R")

http://taku910.github.io/mecab/

Mac

brew install macab
brew install mecab-ipadic

iconv -f Shift_JIS -t UTF8 LSA.txt > LSA8.txt

iconv -f Shift_JIS -t UTF8 doc01.txt > ../Z2/doc01.txt
iconv -f Shift_JIS -t UTF8 doc02.txt > ../Z2/doc02.txt
iconv -f Shift_JIS -t UTF8 doc03.txt > ../Z2/doc03.txt
iconv -f Shift_JIS -t UTF8 doc04.txt > ../Z2/doc04.txt
iconv -f Shift_JIS -t UTF8 doc05.txt > ../Z2/doc05.txt
iconv -f Shift_JIS -t UTF8 doc06.txt > ../Z2/doc06.txt
iconv -f Shift_JIS -t UTF8 doc07.txt > ../Z2/doc07.txt
iconv -f Shift_JIS -t UTF8 doc08.txt > ../Z2/doc08.txt
iconv -f Shift_JIS -t UTF8 doc09.txt > ../Z2/doc09.txt
iconv -f Shift_JIS -t UTF8 doc10.txt > ../Z2/doc10.txt
iconv -f Shift_JIS -t UTF8 doc11.txt > ../Z2/doc11.txt
iconv -f Shift_JIS -t UTF8 doc12.txt > ../Z2/doc12.txt
iconv -f Shift_JIS -t UTF8 doc13.txt > ../Z2/doc13.txt
iconv -f Shift_JIS -t UTF8 doc14.txt > ../Z2/doc14.txt
iconv -f Shift_JIS -t UTF8 doc15.txt > ../Z2/doc15.txt
iconv -f Shift_JIS -t UTF8 doc16.txt > ../Z2/doc16.txt
iconv -f Shift_JIS -t UTF8 doc17.txt > ../Z2/doc17.txt
iconv -f Shift_JIS -t UTF8 doc18.txt > ../Z2/doc18.txt
iconv -f Shift_JIS -t UTF8 doc19.txt > ../Z2/doc19.txt
iconv -f Shift_JIS -t UTF8 doc20.txt > ../Z2/doc20.txt
iconv -f Shift_JIS -t UTF8 doc21.txt > ../Z2/doc21.txt
iconv -f Shift_JIS -t UTF8 doc22.txt > ../Z2/doc22.txt
iconv -f Shift_JIS -t UTF8 doc23.txt > ../Z2/doc23.txt
iconv -f Shift_JIS -t UTF8 doc24.txt > ../Z2/doc24.txt
iconv -f Shift_JIS -t UTF8 doc25.txt > ../Z2/doc25.txt
iconv -f Shift_JIS -t UTF8 doc26.txt > ../Z2/doc26.txt
iconv -f Shift_JIS -t UTF8 doc27.txt > ../Z2/doc27.txt
iconv -f Shift_JIS -t UTF8 doc28.txt > ../Z2/doc28.txt
iconv -f Shift_JIS -t UTF8 doc29.txt > ../Z2/doc29.txt
iconv -f Shift_JIS -t UTF8 doc30.txt > ../Z2/doc30.txt
iconv -f Shift_JIS -t UTF8 doc31.txt > ../Z2/doc31.txt
iconv -f Shift_JIS -t UTF8 doc32.txt > ../Z2/doc32.txt
iconv -f Shift_JIS -t UTF8 doc33.txt > ../Z2/doc33.txt
iconv -f Shift_JIS -t UTF8 doc34.txt > ../Z2/doc34.txt

for i in *.txt;do iconv -f Shift_JIS -t UTF8 $1 > $1.back;done

学習・テスト.txt

R固有のこと

今回のでーたに固有なこと
その他

qiitaに図をあげようとするとエラーになる

参考文献・URL

  1. データマイニング入門, 豊田 秀樹, 東京図書(2008/12/05)
    https://www.amazon.co.jp/dp/product/4489020457/

  2. Rで現在のディレクトリ確認と変更Rで現在のディレクトリ確認と変更
    https://qiita.com/d-cassette/items/59bb6e4b9bbf8e53d2a9

第二章以降の参考文献

  1. Rのニューラルネットパッケージ「neuralnet」を使ってみる
    https://qiita.com/shskwmt/items/65a7f1bca2e8e31b378d

  2. bioinfomatics
    https://bi.biopapyrus.jp

  3. R、R言語、R環境・・・・・・
    http://www.cis.doshisha.ac.jp/mjin/R/

  4. アイアナ:データ分析や人工知能(AI)などの技術雑記
    http://d.hatena.ne.jp/isseing333/20110224/1298512568
    library(som), library(kohonen)

  5. Rによるアソシエーション分析
    https://qiita.com/hidetarou2013@github/items/dc3b448542c5fce7a6ce

  6. パッケージ・ライブラリ http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
    CRAN国内ミラーの使い方
    http://www.okadajp.org/RWiki/?CRAN国内ミラーの使い方

  7. 普段使いなbashのfor文
    https://qiita.com/mikeda/items/483927bba1e556e02b2e

<この項は順次追記しています。>

文書履歴

ver 0.10 初稿 20180123
ver 0.10 誤記訂正 20180402

kaizen_nagoya
I'm a network designer.I work on TOPPERS SmallestSetProfile Kernel,MISRA-C, STARC RTL Design StyleGuide (Verilog-HDL),HAZOP,ISO/IEC15504(AutomotiveSPICE),ISO26262. I was an editor on ISO/IEC 15504.
https://researchmap.jp/blogs/blog_entries/view/81777/f691323917cc4ea12caf0b03b34c8ea0?frame_id=442673
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away