データマイニング入門, 豊田 秀樹, 東京図書(2008/12/05)
https://www.amazon.co.jp/dp/product/4489020457/
第1章を Windows でデータ取得・導入・起動・実行・描画・一括実行。
Raspberry PI, Macintosh, Mac上のdocker/ubuntuでのデータ取得・導入・起動・実行などはこちら
https://qiita.com/kaizen_nagoya/items/e8417310129c2425af59
「データマイニング入門 第9章「潜在意味解析」が本のように動かない件。壁3つ。Macintoshはコードの壁も。」第9章がまだうまく再現できていないという記事はこちら。
https://qiita.com/kaizen_nagoya/items/44567fb589c040aad40d
<この項は書きかけです。順次追記します。>
1. データ取得
東京図書から落とす(Download)
http://www.tokyo-tosho.co.jp/books/978-4-489-02045-2/DL02045_2017.zip
落としただけだと、Rからはみえない。
ダウンロードフォルダを表示して、DL02045_2017を選択して、マウスの右ボタンを押し、「すべて展開」を選ぶ。
罠1 展開しなくてもフォルダの中身が見える
Windowsでは、zipファイルを展開しなくても、フォルダの中身がわかります。
そこで、すべてを展開するのをわすれて、スクリプトを読み込もうとすると、そんなファイルは見当たらない。
2. 導入
はじめてのときは、
https://cran.r-project.org/bin/windows/base/R-3.4.3-win.exe
実行すると
3.起動
Windowsメニューを選ぶと、
Rx64 3.4.3のアイコンが現れている。Windows 64bitならこちらをダブルクリック。32bitならRi386 3.4.3をダブルクリック。
4. スクリプト読み込み
導入時は、導入ユーザのDocumentが作業ディレクトリになっている。
4.1 作業フォルダの変更
RGui(64bit)の「ファイル」メニューを開いて、「作業スペースの読み込み」を選択する。
「DL02045_2017」の「Program」の「chap1」を選択したら「OK」
4.2 スクリプトの読み込み
「ファイル」メニューで、「スクリプトをひらく」を選択し、「ファイル名」の右の方の「R files(.R)」を「All files(.*)」に変更し、「陸上データ... テキストファイル」を選択して「開く(O)」
Rエディタが起動する。
罠2 命令(script)ファイルの拡張子はR
命令(script)ファイルの拡張子はR。拡張子がtxtだと、一瞬、スクリプトだと思って貰えない。
「All files(.)」に変更すれば、txtファイルもScrip
4.3 参考 txtファイルをRファイルに変更
もし、txtじゃいやで、Rファイルにしたければ、
コマンドプロンプトを起動
Microsoft Windows [Version 10.0.14393]
(c) 2016 Microsoft Corporation. All rights reserved.
C:\Users\Administrator>cd Downloads
C:\Users\Administrator\Downloads>cd DL02045_2017
C:\Users\Administrator\Downloads\DL02045_2017>cd Program
C:\Users\Administrator\Downloads\DL02045_2017\Program>cd chap1
C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1>DIR
C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1 のディレクトリ
2018/01/23 11:07 <DIR> .
2018/01/23 11:07 <DIR> ..
2018/01/23 11:05 339 陸上データ.csv
2018/01/23 11:05 245 陸上データ.txt
2 個のファイル 584 バイト
2 個のディレクトリ 74,728,464,384 バイトの空き領域
C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1>COPY *.TXT *.R
陸上データ.txt
1 個のファイルをコピーしました。
5 一括実行
「編集」メニューで、「全て実行」を選択すると、一括実行する。
ただし、plotとhistは画像出力をする先が同じだと、plotの結果が画面に残らない。
図の保存方法
図を選択して「ファイル」メニューの「別名で保存」の「Jpeg」「Png」などその後の作業に便利な種類(大きさも考慮)をえらびぶ。ディスクに空きがあれば、「100%の品質」で保存。100%の品質でファイルがおおきければ、75%, 50%を後から選べば良い。
罠3 出力先の既定値は一つ
描画機能は、出力先を別に指定しないと一つの場所に描こうとする。plot, histとつづけて描くと先の絵は消える。
chap2で、plotで連続して2つ描いたら、別々の出力が出た。plotとhistの関係を要調査。
6 逐次実行
1行づつ実行するには、Rコンソールにコマンド(script)をコピペしてリターンしてもよい。
また、Rエディタの実行したい行を選んで、「カーソル行または選択中のRコードを実行」
なんとか1章を実行できました。
困ったこと、まようこと
困り1 UTF-8以外のデータ
困り2 図を上がきする
chap1
chap3
chap2は別々にでる。(Windows)
困り3 packageが未導入
- options(CRAN="http://cran.md.tsukuba.ac.jp/")
install.packages("xxx", dep=T) # 依存関係を考慮しつつ(dep=T)
chap2
install.packages文なし
chap3
install..packages文あり
install.packages("rpart")
install.packages("rpart.plot")
install.packages("partykit")
chap4
animal1.txt
install.packages("som") #20180124 Dr.Kiyoshi Ogawa add
library(som)
cocktail.txt
install.packages("kohonen")
library(kohonen)
chap5
animal2.txt
install.packages("arules")
library(arules)
chap8
お札.txt
install.packages("e1071")
install.packages("scatterplot3d")
#chap9
install.packages("RMeCab", repos = "http://rmecab.jp/R")
Mac
brew install macab
brew install mecab-ipadic
iconv -f Shift_JIS -t UTF8 LSA.txt > LSA8.txt
iconv -f Shift_JIS -t UTF8 doc01.txt > ../Z2/doc01.txt
iconv -f Shift_JIS -t UTF8 doc02.txt > ../Z2/doc02.txt
iconv -f Shift_JIS -t UTF8 doc03.txt > ../Z2/doc03.txt
iconv -f Shift_JIS -t UTF8 doc04.txt > ../Z2/doc04.txt
iconv -f Shift_JIS -t UTF8 doc05.txt > ../Z2/doc05.txt
iconv -f Shift_JIS -t UTF8 doc06.txt > ../Z2/doc06.txt
iconv -f Shift_JIS -t UTF8 doc07.txt > ../Z2/doc07.txt
iconv -f Shift_JIS -t UTF8 doc08.txt > ../Z2/doc08.txt
iconv -f Shift_JIS -t UTF8 doc09.txt > ../Z2/doc09.txt
iconv -f Shift_JIS -t UTF8 doc10.txt > ../Z2/doc10.txt
iconv -f Shift_JIS -t UTF8 doc11.txt > ../Z2/doc11.txt
iconv -f Shift_JIS -t UTF8 doc12.txt > ../Z2/doc12.txt
iconv -f Shift_JIS -t UTF8 doc13.txt > ../Z2/doc13.txt
iconv -f Shift_JIS -t UTF8 doc14.txt > ../Z2/doc14.txt
iconv -f Shift_JIS -t UTF8 doc15.txt > ../Z2/doc15.txt
iconv -f Shift_JIS -t UTF8 doc16.txt > ../Z2/doc16.txt
iconv -f Shift_JIS -t UTF8 doc17.txt > ../Z2/doc17.txt
iconv -f Shift_JIS -t UTF8 doc18.txt > ../Z2/doc18.txt
iconv -f Shift_JIS -t UTF8 doc19.txt > ../Z2/doc19.txt
iconv -f Shift_JIS -t UTF8 doc20.txt > ../Z2/doc20.txt
iconv -f Shift_JIS -t UTF8 doc21.txt > ../Z2/doc21.txt
iconv -f Shift_JIS -t UTF8 doc22.txt > ../Z2/doc22.txt
iconv -f Shift_JIS -t UTF8 doc23.txt > ../Z2/doc23.txt
iconv -f Shift_JIS -t UTF8 doc24.txt > ../Z2/doc24.txt
iconv -f Shift_JIS -t UTF8 doc25.txt > ../Z2/doc25.txt
iconv -f Shift_JIS -t UTF8 doc26.txt > ../Z2/doc26.txt
iconv -f Shift_JIS -t UTF8 doc27.txt > ../Z2/doc27.txt
iconv -f Shift_JIS -t UTF8 doc28.txt > ../Z2/doc28.txt
iconv -f Shift_JIS -t UTF8 doc29.txt > ../Z2/doc29.txt
iconv -f Shift_JIS -t UTF8 doc30.txt > ../Z2/doc30.txt
iconv -f Shift_JIS -t UTF8 doc31.txt > ../Z2/doc31.txt
iconv -f Shift_JIS -t UTF8 doc32.txt > ../Z2/doc32.txt
iconv -f Shift_JIS -t UTF8 doc33.txt > ../Z2/doc33.txt
iconv -f Shift_JIS -t UTF8 doc34.txt > ../Z2/doc34.txt
for i in *.txt;do iconv -f Shift_JIS -t UTF8 $1 > $1.back;done
学習・テスト.txt
R固有のこと
今回のでーたに固有なこと
その他
qiitaに図をあげようとするとエラーになる
参考文献・URL
-
データマイニング入門, 豊田 秀樹, 東京図書(2008/12/05)
https://www.amazon.co.jp/dp/product/4489020457/ -
Rで現在のディレクトリ確認と変更Rで現在のディレクトリ確認と変更
https://qiita.com/d-cassette/items/59bb6e4b9bbf8e53d2a9
第二章以降の参考文献
-
Rのニューラルネットパッケージ「neuralnet」を使ってみる
https://qiita.com/shskwmt/items/65a7f1bca2e8e31b378d -
bioinfomatics
https://bi.biopapyrus.jp -
R、R言語、R環境・・・・・・
http://www.cis.doshisha.ac.jp/mjin/R/ -
アイアナ:データ分析や人工知能(AI)などの技術雑記
http://d.hatena.ne.jp/isseing333/20110224/1298512568
library(som), library(kohonen) -
Rによるアソシエーション分析
https://qiita.com/hidetarou2013@github/items/dc3b448542c5fce7a6ce -
パッケージ・ライブラリ http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
CRAN国内ミラーの使い方
http://www.okadajp.org/RWiki/?CRAN国内ミラーの使い方 -
普段使いなbashのfor文
https://qiita.com/mikeda/items/483927bba1e556e02b2e
<この記事は個人の過去の経験に基づく個人の感想です。現在所属する組織、業務とは関係がありません。>
文書履歴
ver. 0.10 初稿 20180123
ver. 0.11 誤記訂正 20180402
ver. 0.12 URL追記 20230228
最後までおよみいただきありがとうございました。
いいね 💚、フォローをお願いします。
Thank you very much for reading to the last sentence.
Please press the like icon 💚 and follow me for your happy life.