初めに
- Word,Excel,Powerpointはバイナリファイル(xmlを圧縮したデータのため)なので、通常は変更内容(diff)の表示はできない。それでは不便なのでgit上でdiffを表示するために必要な手段を述べる。
- 環境
- Windows
- GitHub Desktop
- GitHubとの連携が初心者でも簡単にできるため。また、自動的に更新されることが便利なので用いる。
アプリのインストール
tika
-
https://tika.apache.org/download.html から
tika-app-{バージョン}.jar
の最新バージョンをダウンロード。{バージョン}
は最新のバージョンに置き換える。 -
C:\\Program Files\\
にtikaフォルダを作り、tika-app-{バージョン}.jar
を入れる。
java
- https://www.java.com/download/ie_manual.jsp からダウンロード、インストール。再起動する。
設定の記述
- リポジトリのあるフォルダ内に
.gitattributes
ファイルを作り、以下の内容を記載。- これはWord,Powerpoint,Excelの拡張子のファイルがある場合にはtikaを使ってdiffを表示するということを指定している。
*.doc diff=tika
*.docx diff=tika
*.ppt diff=tika
*.pptx diff=tika
*.xls diff=tika
*.xlsx diff=tika
- リポジトリのあるフォルダ内に
.gitignore
ファイルを作り、以下の内容を記載。- Wordを開いて作業中は未保存のデータが一時的に保存される。これがあるとGitで変更履歴の記録を行うことができないので、無視する設定を行う。
~*
- リポジトリの
.git/config
ファイルの最後に以下の内容を追加。- これはtikaを指定したときに実行されるコマンドを指定する。
{バージョン}
は実際に使うバージョンに置き換える。
- これはtikaを指定したときに実行されるコマンドを指定する。
[diff "tika"]
binary = true
textconv = java -Dfile.encoding=UTF-8 -jar 'C:\\Program Files\\tika\\tika-app-{バージョン}.jar' -t
参考リンク