はじめに
自然言語処理のデモのために、livedoorニュースコーパスをダウンロードしてみたらtar.gz形式で圧縮されていたので、その解答の仕方を調べてみた。
忘れそうなので備忘録
※なお、ライブドアコーパスのダウンロードはここ
株式会社ロンウイットが、収集して配布してくださっているデータらしい。便利。
#コード
import tarfile
with tarfile.open('ldcc-20140209.tar.gz') as tar:
for i in tar.getmembers():
tar.extractall()
参考
下記を参考にさせていただいております。
https://analytics-note.xyz/machine-learning/download-livedoor-news/