HTMLでかかれたものをQiitaにあげるのに、Markdown形式に変換したくて調べていたところ、Pandocというツールがいい感じだったので、Pandocのインストールから簡単な使い方をまとめておきます。
インストール
私の場合、Ubuntuだとパッケージがあったので、apt-getでインストールします。
$ sudo apt-get install pandoc
HTML->Markdown変換
コマンドラインで、
$ pandoc -s test.html -o out.txt
また、直接サイトのHTMLを変換することもできます。
$ pandoc -s -r html http://www.gnu.org/software/make/ -o example.txt
おわりに
ちゃんと構造化されているようなHTMLだと期待通りの変換ができました。他にもLaTeXやmanなども相互変換できるようです。