1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

KH Coderでフォルダごと分析するとエラーが吐き出される件

Last updated at Posted at 2019-12-18

1. そもそもの話

プロジェクト > インポート > フォルダ内の複数テキスト でデータをインポートすると、事前にデータをインポートせずともKH Coder内で統合分析できるようになる。マニュアルを流し読みしてたので、最近読み直して初めて知った。便利。

そこで、今まで手作業で統合させていたcsvファイルをフォルダごと突っ込んでテキストチェックにかけてみたところ、エラーが生じた。

**「UTF-8に変換しろー!」**と。

1-1. 一応変換してみるも

テキスト分析は、基本的にRを中心に、補助的に(とくに予備的分析のために)KH Coderを使っている。
RはRstudioで使っているので、できればShift-JISで保存しておきたいのだが、まぁしょうがないということで、指示通りUTF-8に変換してみた。

すると、別のエラーが発生。

**「MeCabが起動できません」**と。
そしてソフトが自動で落ちてしまった…

1-2. MeCabがダメ?

解析エンジンの問題なのか?
ならばChaSenで対抗だ。

とやってみたが、結局同じようなエラーが出てしまう。

何故だ…

1-3. csvファイルが壊れた?

そもそも根本がダメなのかもしれない。

というわけで、UTF-8のcsv単体を読み込ませると、普通にできた。
なのでファイル自体が悪いわけではなさそう。

2. 解決:txtにしてみた

もしやcsvじゃダメなのか?
ということで、拡張子をtxtに書き換えて読み込ませてみたら、あっさりできた。

3. ちなみに

最近、別の機会で同じような分析をする機会があったとき、貰ったdocxをファイルごと分析にかけてみたら読み込めた。
他方、さらに別件でxlsxデータで試みたが、この時はできなかった。
ということで、フォルダごと分析するときはtxtかdocxが良いらしい。一応解決。
ただ、外部変数を使おうとすると何らかのエクセルファイルが必要になるので、アップデートに期待しましょう。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?