More than 5 years have passed since last update.

TeX原稿から略語一覧を取得するシェルスクリプト

Last updated at 2019-07-17Posted at 2019-05-29

用途

論文では本文中に使用している略語を一覧にして表にまとめることがある。
TeXなどのテキストファイル原稿から略語を抽出するシェルスクリプト。

指定したファイル（コード例ではカレントディレクトリの拡張子が".tex"のファイル）から
grepの正規表現で、「半角カッコに囲まれた半角数字、アルファベット(大文字小文字問わず)、スラッシュ、ハイフン、ピリオドのみで構成される２文字以上の要素」を探し出している。

注意点

ソースファイル内の使用箇所を表示する場合。
grepの"-n"、"--color"オプションでそれぞれ行番号を表示、色つけしている。

for file in `ls *.tex`; do
  echo ${file}
  grep -n --color=always -e '([0-9a-zA-Z|/|.|-]\{2,\})' ${file}
  echo
done

略語のみ一覧にしてアルファベット順にソートする場合。

for file in `ls ${SRCDIR}/*.tex`; do
  grep -o -e '([0-9a-zA-Z|/|.|-]\{2,\})' ${file}
done | sed "s/^(\(.*\))$/\1/" | sort -f -d | uniq