データマイニング入門, 豊田 秀樹, 東京図書(2008/12/05)
https://www.amazon.co.jp/dp/product/4489020457/
第1章を Windows でデータ取得・導入・起動・実行・描画・一括実行。
Raspberry PI, Macintosh, Mac上のdocker/ubuntuでのデータ取得・導入・起動・実行などはこちら
https://qiita.com/kaizen_nagoya/items/e8417310129c2425af59
「データマイニング入門 第9章「潜在意味解析」が本のように動かない件。壁3つ。Macintoshはコードの壁も。」第9章がまだうまく再現できていないという記事はこちら。
https://qiita.com/kaizen_nagoya/items/44567fb589c040aad40d
<この項は書きかけです。順次追記します。>
1. データ取得
東京図書から落とす(Download)
http://www.tokyo-tosho.co.jp/books/978-4-489-02045-2/DL02045_2017.zip
落としただけだと、Rからはみえない。
ダウンロードフォルダを表示して、DL02045_2017を選択して、マウスの右ボタンを押し、「すべて展開」を選ぶ。
罠1 展開しなくてもフォルダの中身が見える
Windowsでは、zipファイルを展開しなくても、フォルダの中身がわかります。
そこで、すべてを展開するのをわすれて、スクリプトを読み込もうとすると、そんなファイルは見当たらない。
2. 導入
はじめてのときは、
https://cran.r-project.org/bin/windows/base/R-3.4.3-win.exe
実行すると
3.起動
Windowsメニューを選ぶと、
Rx64 3.4.3のアイコンが現れている。Windows 64bitならこちらをダブルクリック。32bitならRi386 3.4.3をダブルクリック。
4. スクリプト読み込み
導入時は、導入ユーザのDocumentが作業ディレクトリになっている。
4.1 作業フォルダの変更
RGui(64bit)の「ファイル」メニューを開いて、「作業スペースの読み込み」を選択する。
「DL02045_2017」の「Program」の「chap1」を選択したら「OK」
4.2 スクリプトの読み込み
「ファイル」メニューで、「スクリプトをひらく」を選択し、「ファイル名」の右の方の「R files(.R)」を「All files(.*)」に変更し、「陸上データ... テキストファイル」を選択して「開く(O)」
Rエディタが起動する。
罠2 命令(script)ファイルの拡張子はR
命令(script)ファイルの拡張子はR。拡張子がtxtだと、一瞬、スクリプトだと思って貰えない。
「All files(.)」に変更すれば、txtファイルもScrip
4.3 参考 txtファイルをRファイルに変更
もし、txtじゃいやで、Rファイルにしたければ、
コマンドプロンプトを起動
Microsoft Windows [Version 10.0.14393]
(c) 2016 Microsoft Corporation. All rights reserved.
C:\Users\Administrator>cd Downloads
C:\Users\Administrator\Downloads>cd DL02045_2017
C:\Users\Administrator\Downloads\DL02045_2017>cd Program
C:\Users\Administrator\Downloads\DL02045_2017\Program>cd chap1
C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1>DIR
C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1 のディレクトリ
2018/01/23 11:07 <DIR> .
2018/01/23 11:07 <DIR> ..
2018/01/23 11:05 339 陸上データ.csv
2018/01/23 11:05 245 陸上データ.txt
2 個のファイル 584 バイト
2 個のディレクトリ 74,728,464,384 バイトの空き領域
C:\Users\Administrator\Downloads\DL02045_2017\Program\chap1>COPY *.TXT *.R
陸上データ.txt
1 個のファイルをコピーしました。
5 一括実行
「編集」メニューで、「全て実行」を選択すると、一括実行する。
ただし、plotとhistは画像出力をする先が同じだと、plotの結果が画面に残らない。
図の保存方法
図を選択して「ファイル」メニューの「別名で保存」の「Jpeg」「Png」などその後の作業に便利な種類(大きさも考慮)をえらびぶ。ディスクに空きがあれば、「100%の品質」で保存。100%の品質でファイルがおおきければ、75%, 50%を後から選べば良い。
罠3 出力先の既定値は一つ
描画機能は、出力先を別に指定しないと一つの場所に描こうとする。plot, histとつづけて描くと先の絵は消える。
chap2で、plotで連続して2つ描いたら、別々の出力が出た。plotとhistの関係を要調査。
6 逐次実行
1行づつ実行するには、Rコンソールにコマンド(script)をコピペしてリターンしてもよい。
また、Rエディタの実行したい行を選んで、「カーソル行または選択中のRコードを実行」
なんとか1章を実行できました。
困ったこと、まようこと
困り1 UTF-8以外のデータ
困り2 図を上がきする
chap1
chap3
chap2は別々にでる。(Windows)
困り3 packageが未導入
- options(CRAN="http://cran.md.tsukuba.ac.jp/")
install.packages("xxx", dep=T) # 依存関係を考慮しつつ(dep=T)
chap2
install.packages文なし
chap3
install..packages文あり
install.packages("rpart")
install.packages("rpart.plot")
install.packages("partykit")
chap4
animal1.txt
install.packages("som") #20180124 Dr.Kiyoshi Ogawa add
library(som)
cocktail.txt
install.packages("kohonen")
library(kohonen)
chap5
animal2.txt
install.packages("arules")
library(arules)
chap8
お札.txt
install.packages("e1071")
install.packages("scatterplot3d")
#chap9
install.packages("RMeCab", repos = "http://rmecab.jp/R")
Mac
brew install macab
brew install mecab-ipadic
iconv -f Shift_JIS -t UTF8 LSA.txt > LSA8.txt
iconv -f Shift_JIS -t UTF8 doc01.txt > ../Z2/doc01.txt
iconv -f Shift_JIS -t UTF8 doc02.txt > ../Z2/doc02.txt
iconv -f Shift_JIS -t UTF8 doc03.txt > ../Z2/doc03.txt
iconv -f Shift_JIS -t UTF8 doc04.txt > ../Z2/doc04.txt
iconv -f Shift_JIS -t UTF8 doc05.txt > ../Z2/doc05.txt
iconv -f Shift_JIS -t UTF8 doc06.txt > ../Z2/doc06.txt
iconv -f Shift_JIS -t UTF8 doc07.txt > ../Z2/doc07.txt
iconv -f Shift_JIS -t UTF8 doc08.txt > ../Z2/doc08.txt
iconv -f Shift_JIS -t UTF8 doc09.txt > ../Z2/doc09.txt
iconv -f Shift_JIS -t UTF8 doc10.txt > ../Z2/doc10.txt
iconv -f Shift_JIS -t UTF8 doc11.txt > ../Z2/doc11.txt
iconv -f Shift_JIS -t UTF8 doc12.txt > ../Z2/doc12.txt
iconv -f Shift_JIS -t UTF8 doc13.txt > ../Z2/doc13.txt
iconv -f Shift_JIS -t UTF8 doc14.txt > ../Z2/doc14.txt
iconv -f Shift_JIS -t UTF8 doc15.txt > ../Z2/doc15.txt
iconv -f Shift_JIS -t UTF8 doc16.txt > ../Z2/doc16.txt
iconv -f Shift_JIS -t UTF8 doc17.txt > ../Z2/doc17.txt
iconv -f Shift_JIS -t UTF8 doc18.txt > ../Z2/doc18.txt
iconv -f Shift_JIS -t UTF8 doc19.txt > ../Z2/doc19.txt
iconv -f Shift_JIS -t UTF8 doc20.txt > ../Z2/doc20.txt
iconv -f Shift_JIS -t UTF8 doc21.txt > ../Z2/doc21.txt
iconv -f Shift_JIS -t UTF8 doc22.txt > ../Z2/doc22.txt
iconv -f Shift_JIS -t UTF8 doc23.txt > ../Z2/doc23.txt
iconv -f Shift_JIS -t UTF8 doc24.txt > ../Z2/doc24.txt
iconv -f Shift_JIS -t UTF8 doc25.txt > ../Z2/doc25.txt
iconv -f Shift_JIS -t UTF8 doc26.txt > ../Z2/doc26.txt
iconv -f Shift_JIS -t UTF8 doc27.txt > ../Z2/doc27.txt
iconv -f Shift_JIS -t UTF8 doc28.txt > ../Z2/doc28.txt
iconv -f Shift_JIS -t UTF8 doc29.txt > ../Z2/doc29.txt
iconv -f Shift_JIS -t UTF8 doc30.txt > ../Z2/doc30.txt
iconv -f Shift_JIS -t UTF8 doc31.txt > ../Z2/doc31.txt
iconv -f Shift_JIS -t UTF8 doc32.txt > ../Z2/doc32.txt
iconv -f Shift_JIS -t UTF8 doc33.txt > ../Z2/doc33.txt
iconv -f Shift_JIS -t UTF8 doc34.txt > ../Z2/doc34.txt
for i in *.txt;do iconv -f Shift_JIS -t UTF8 $1 > $1.back;done
学習・テスト.txt
R固有のこと
今回のでーたに固有なこと
その他
qiitaに図をあげようとするとエラーになる
参考文献・URL
-
データマイニング入門, 豊田 秀樹, 東京図書(2008/12/05)
https://www.amazon.co.jp/dp/product/4489020457/ -
Rで現在のディレクトリ確認と変更Rで現在のディレクトリ確認と変更
https://qiita.com/d-cassette/items/59bb6e4b9bbf8e53d2a9
第二章以降の参考文献
-
Rのニューラルネットパッケージ「neuralnet」を使ってみる
https://qiita.com/shskwmt/items/65a7f1bca2e8e31b378d -
bioinfomatics
https://bi.biopapyrus.jp -
R、R言語、R環境・・・・・・
http://www.cis.doshisha.ac.jp/mjin/R/ -
アイアナ:データ分析や人工知能(AI)などの技術雑記
http://d.hatena.ne.jp/isseing333/20110224/1298512568
library(som), library(kohonen) -
Rによるアソシエーション分析
https://qiita.com/hidetarou2013@github/items/dc3b448542c5fce7a6ce -
パッケージ・ライブラリ http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
CRAN国内ミラーの使い方
http://www.okadajp.org/RWiki/?CRAN国内ミラーの使い方 -
普段使いなbashのfor文
https://qiita.com/mikeda/items/483927bba1e556e02b2e
物理記事 上位100
https://qiita.com/kaizen_nagoya/items/66e90fe31fbe3facc6ff
数学関連記事100
https://qiita.com/kaizen_nagoya/items/d8dadb49a6397e854c6d
言語・文学記事 100
https://qiita.com/kaizen_nagoya/items/42d58d5ef7fb53c407d6
医工連携関連記事一覧
https://qiita.com/kaizen_nagoya/items/6ab51c12ba51bc260a82
通信記事100
https://qiita.com/kaizen_nagoya/items/1d67de5e1cd207b05ef7
自動車 記事 100
https://qiita.com/kaizen_nagoya/items/f7f0b9ab36569ad409c5
Qiita(0)Qiita関連記事一覧(自分)
https://qiita.com/kaizen_nagoya/items/58db5fbf036b28e9dfa6
鉄道(0)鉄道のシステム考察はてっちゃんがてつだってくれる
https://qiita.com/kaizen_nagoya/items/26bda595f341a27901a0
日本語(0)一欄
https://qiita.com/kaizen_nagoya/items/7498dcfa3a9ba7fd1e68
英語(0) 一覧
https://qiita.com/kaizen_nagoya/items/680e3f5cbf9430486c7d
転職(0)一覧
https://qiita.com/kaizen_nagoya/items/f77520d378d33451d6fe
仮説(0)一覧(目標100現在40)
https://qiita.com/kaizen_nagoya/items/f000506fe1837b3590df
安全(0)安全工学シンポジウムに向けて: 21
https://qiita.com/kaizen_nagoya/items/c5d78f3def8195cb2409
Error一覧 error(0)
https://qiita.com/kaizen_nagoya/items/48b6cbc8d68eae2c42b8
Ethernet 記事一覧 Ethernet(0)
https://qiita.com/kaizen_nagoya/items/88d35e99f74aefc98794
Wireshark 一覧 wireshark(0)、Ethernet(48)
https://qiita.com/kaizen_nagoya/items/fbed841f61875c4731d0
線網(Wi-Fi)空中線(antenna)(0) 記事一覧(118/300目標)
https://qiita.com/kaizen_nagoya/items/5e5464ac2b24bd4cd001
OSEK OS設計の基礎 OSEK(100)
https://qiita.com/kaizen_nagoya/items/7528a22a14242d2d58a3
官公庁・学校・公的団体(NPOを含む)システムの課題、官(0)
https://qiita.com/kaizen_nagoya/items/04ee6eaf7ec13d3af4c3
Error一覧(C/C++, python, bash...) Error(0)
https://qiita.com/kaizen_nagoya/items/48b6cbc8d68eae2c42b8
C++ Support(0)
https://qiita.com/kaizen_nagoya/items/8720d26f762369a80514
Coding Rules(0) C Secure , MISRA and so on
https://qiita.com/kaizen_nagoya/items/400725644a8a0e90fbb0
なぜdockerで機械学習するか 書籍・ソース一覧作成中 (目標100)
https://qiita.com/kaizen_nagoya/items/ddd12477544bf5ba85e2
言語処理100本ノックをdockerで。python覚えるのに最適。:10+12
https://qiita.com/kaizen_nagoya/items/7e7eb7c543e0c18438c4
プログラムちょい替え(0)一覧:4件
https://qiita.com/kaizen_nagoya/items/296d87ef4bfd516bc394
TOPPERSまとめ #名古屋のIoTは名古屋のOSで
https://qiita.com/kaizen_nagoya/items/9026c049cb0309b9d451
自動制御、制御工学一覧(0)
https://qiita.com/kaizen_nagoya/items/7767a4e19a6ae1479e6b
プログラマが知っていると良い「公序良俗」
https://qiita.com/kaizen_nagoya/items/9fe7c0dfac2fbd77a945
一覧の一覧( The directory of directories of mine.) Qiita(100)
https://qiita.com/kaizen_nagoya/items/7eb0e006543886138f39
自動制御、制御工学一覧(0)
https://qiita.com/kaizen_nagoya/items/7767a4e19a6ae1479e6b
小川清最終講義、小川清最終講義(再)計画, Ethernet(100) 英語(100) 安全(100)
https://qiita.com/kaizen_nagoya/items/e2df642e3951e35e6a53
<この記事は個人の過去の経験に基づく個人の感想です。現在所属する組織、業務とは関係がありません。>
This article is an individual impression based on the individual's experience. It has nothing to do with the organization or business to which I currently belong.
文書履歴(document history)
ver. 0.10 初稿 20180123
ver. 0.11 誤記訂正 20180402
ver. 0.12 URL追記 20230228
最後までおよみいただきありがとうございました。
いいね 💚、フォローをお願いします。
Thank you very much for reading to the last sentence.
Please press the like icon 💚 and follow me for your happy life.