1. GoogleFormデータのクセ
1-1. 共通
- ダウンロードしたCSVファイルは、設問も選択された回答も、文字列がそのまま落ちてきます。
- (ちなみに1) 回答の最後に改行を入れないと、R で読み込むときに最後の行が対象外になることがあります。
- (ちなみに2) エクセルで開くと文字化けする場合は、文字コードを UTF-8 から ANSI に変えるとよきです。
1-2. 複数回答
- 選択された回答がデリミタ(セミコロン)で結合されます。
例) "かつ丼;ラーメン;鳥から" - 「その他」選択肢に記入されたフリーアンサーも、結合されます。
例) "かつ丼;ラーメン;鳥から;大盛りだとなおうれしい"
2. GoogleForm集計の問題
2-1. 標準で提供される集計結果
2-2. 標準で提供される集計結果の問題点
- 図形としてコピーできるだけなので、加工ができません。
- 「その他」が記述内容ごとに出力されるので、回答数によっては冗長になります。
- クロス集計など統計的処理ができません。(単純集計のみ)
3. (文字列を数値に変換する)Excelによる解決手法と問題
3-1. ワークシート関数の例
(単回答:問題ないパターン)
(セルB3) =IF(A3="とても賛成",1,IF(A3="賛成",2,IF(A3="どちらともいえない",3,IF(A3="反対",4,IF(A3="とても反対",5)))))
(複数回答:問題になる場合があるパターン)
(セルB3) =IF(ISERROR(FIND(B$1,$A3)=1),0,1)
(セルF3) =SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE($A3,$B$1,""),$C$1,""),$D$1,""),$E$1,""),";","")
(A列が元のデータで、B列~F列が変換後です)
選択肢4番目の「かつ丼・ミニラーメンセット」の文字列は、1「かつ丼」, 2「ラーメン」を含んでいるため、太枠で囲ったところが誤変換されています。("1"が立ってしまっている)
回避できるように選択肢を工夫(選択肢間で同じ文字列を含まないように)すればよいのですが、工夫や検証がめんどーです。
(また、「その他」に選択肢と同じ文字列を入れられると、集計が合わなくなります)
そこで、次の記事(2)にてRを使ったデータ加工方法を示します。