LoginSignup
0
0

言語処理100本ノック 2015 落ち穂拾い 第3章: 正規表現

Last updated at Posted at 2019-01-21

言語処理100本ノック2015
http://www.cl.ecei.tohoku.ac.jp/nlp100/

自分では全部まだできていない。次の資料を参考にさせていただいている。

素人の言語処理100本ノック:まとめ
https://qiita.com/segavvy/items/fb50ba8097d59475f760

環境構築

Dockerでpython言語処理100本ノック
https://qiita.com/taguchi_tomo/items/24483ceaea7638e83310

言語処理100本ノックをdockerで。
https://qiita.com/kaizen_nagoya/items/7e7eb7c543e0c18438c4

Windows(MS)にPython(Anaconda)を導入する(6つの罠)
https://qiita.com/kaizen_nagoya/items/7bfd7ecdc4e8edcbd679

play with docker

65歳からのプログラミング入門
https://qiita.com/kaizen_nagoya/items/1561f910c275b22d7c9f

Play with Docker でエラー
https://qiita.com/kaizen_nagoya/items/fbf054705bff725dbc25

65歳からのプログラミング入門(2) 二日目
https://qiita.com/kaizen_nagoya/items/57f362fb801fd3132803

今日の作業記録 python error(言語処理100本ノック:20)解決
https://qiita.com/kaizen_nagoya/items/c82ebccfef5522de53b9

# wget http://www.cl.ecei.tohoku.ac.jp/nlp100/data/jawiki-country.json.gz

第3章: 正規表現

「2014年10月18日付けの日本語のWikipedia記事のダンプの中から,国家に言及していると思われる記事を抽出し,JSON形式で格納したものです.このファイルは,クリエイティブ・コモンズ 表示-継承 3.0 非移植のライセンスで配布されています.」

https://creativecommons.org/licenses/by-sa/3.0/legalcode
https://creativecommons.org/licenses/by-sa/3.0/deed.ja

20. JSONデータの読み込み

素人の言語処理100本ノック:20
https://qiita.com/segavvy/items/dc1e63fd8f7bd5d99eea

21. カテゴリ名を含む行を抽出

素人の言語処理100本ノック:21
https://qiita.com/segavvy/items/73f1b91ff75529ae3b8d

参考にした正規表現の記事

正規表現のまとめ
https://qiita.com/tsugar/items/9e2c8d3fd1a107ad8ad4

22. カテゴリ名の抽出

素人の言語処理100本ノック:22
https://qiita.com/segavvy/items/3e7de80f88c2c1096bef

23. セクション構造

素人の言語処理100本ノック:23
https://qiita.com/segavvy/items/691ac169dd5b36e6a187

24. ファイル参照の抽出

素人の言語処理100本ノック:24

25. テンプレートの抽出

素人の言語処理100本ノック:25
https://qiita.com/segavvy/items/e402ad0a5b0f52453d7f

26. 強調マークアップの除去

素人の言語処理100本ノック:26
https://qiita.com/segavvy/items/f6d0f3d6eee5acc33c58

27. 内部リンクの除去

素人の言語処理100本ノック:27
https://qiita.com/segavvy/items/9a8137f045852bc299d6

28. MediaWikiマークアップの除去

素人の言語処理100本ノック:28
https://qiita.com/segavvy/items/8c4567ec1124320d3354

29. 国旗画像のURLを取得する

素人の言語処理100本ノック:29
https://qiita.com/segavvy/items/fc7257012d8a590185e5

参考資料(reference)

Play with Docker でエラー
https://qiita.com/kaizen_nagoya/items/fbf054705bff725dbc25
言語処理100本ノック 2015(python) 動作確認docker環境構築
https://qiita.com/kaizen_nagoya/items/abaf3fd0198f9f557243
言語処理100本ノック 2015(python) 落ち穂拾い 第1章: 準備運動 00, 01, 02, 03, 04, 05, 06,07
https://qiita.com/kaizen_nagoya/items/ee1b625b0b65cd63d42a
「Python 入門」の入門
https://qiita.com/kaizen_nagoya/items/22c99c5926984ede6573
Windows(MS)にPython(Anaconda)を導入する(6つの罠)
https://qiita.com/kaizen_nagoya/items/7bfd7ecdc4e8edcbd679
65歳からのプログラミング入門
https://qiita.com/kaizen_nagoya/items/1561f910c275b22d7c9f
65歳からのプログラミング入門(2) 二日目
https://qiita.com/kaizen_nagoya/items/57f362fb801fd3132803
なぜdockerで機械学習するか 書籍・ソース一覧作成中 (目標100)
https://qiita.com/kaizen_nagoya/items/ddd12477544bf5ba85e2
dockerで機械学習 with anaconda(1)「ゼロから作るDeep Learning - Pythonで学ぶディープラーニングの理論と実装」斎藤 康毅 著
https://qiita.com/kaizen_nagoya/items/a7e94ef6dca128d035ab
dockerで機械学習with anaconda(2)「ゼロから作るDeep Learning2自然言語処理編」斎藤 康毅 著
https://qiita.com/kaizen_nagoya/items/3b80dfc76933cea522c6
プログラミング言語教育のXYZ
https://qiita.com/kaizen_nagoya/items/1950c5810fb5c0b07be4

文書履歴(document history)

ver. 0.01 初稿 20190121
ver. 0.02 参考資料追記 20190123

最後までおよみいただきありがとうございました。

いいね 💚、フォローをお願いします。

Thank you very much for reading to the last sentence.

Please press the like icon 💚 and follow me for your happy life.

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0