4
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

twitter内(API含む)で使われる言語コード一覧(Python辞書付)。よく使われる言語は?

Posted at

本題

まず、入力用に横向きでは、
lang_dict.py
{'en': '英語', 'und': '不明', 'is': 'アイスランド語', 'ay': 'アイマラ語', 'ga': 'アイルランド語', 'az': 'アゼルバイジェン語', 'as': 'アッサム語', 'aa': 'アファル語', 'ab': 'アプハジア語', 'af': 'アフリカーンス語', 'am': 'アムハラ語', 'ar': 'アラビア語', 'sq': 'アルバニア語', 'hy': 'アルメニア語', 'it': 'イタリア語', 'yi': 'イディッシュ語', 'iu': 'イヌクティトット語', 'ik': 'イヌピア語', 'ia': 'インターリングア', 'ie': 'インターリング語', 'in': 'インドネシア語', 'ug': 'ウイグル語', 'cy': 'ウェールズ語', 'vo': 'ヴォラピュック語', 'wo': 'ウォロフ語', 'uk': 'ウクライナ語', 'uz': 'ウズベク語', 'ur': 'ウルドゥー語', 'et': 'エストニア語', 'eo': 'エスペラント語', 'or': 'オーリア語', 'oc': 'オキタン語', 'nl': 'オランダ語', 'om': 'オロモ語', 'kk': 'カザフ語', 'ks': 'カシミール語', 'ca': 'カタラン語', 'gl': 'ガリシア語', 'ko': '韓国語', 'kn': 'カンナダ語', 'km': 'カンボジア語', 'rw': 'キヤーワンダ語', 'el': 'ギリシャ語', 'ky': 'キルギス語', 'rn': 'キルンディ語', 'gn': 'グアラニー語', 'qu': 'クエチュア語', 'gu': 'グジャラト語', 'kl': 'グリーンランド語', 'ku': 'クルド語', 'ckb': '中央クルド語', 'hr': 'クロアチア語', 'gd': 'ゲーリック語', 'gv': 'ゲーリック語', 'xh': 'コーサ語', 'co': 'コルシカ語', 'sm': 'サモア語', 'sg': 'サングホ語', 'sa': 'サンスクリット語', 'ss': 'シスワティ語', 'jv': 'ジャワ語', 'ka': 'ジョージア語', 'sn': 'ショナ語', 'sd': 'シンド語', 'si': 'シンハラ語', 'sv': 'スウェーデン語', 'su': 'スーダン語', 'zu': 'ズールー語', 'es': 'スペイン語', 'sk': 'スロヴァキア語', 'sl': 'スロヴェニア語', 'sw': 'スワヒリ語', 'tn': 'セツワナ語', 'st': 'セト語', 'sr': 'セルビア語', 'sh': 'セルボクロアチア語', 'so': 'ソマリ語', 'th': 'タイ語', 'tl': 'タガログ語', 'tg': 'タジク語', 'tt': 'タタール語', 'ta': 'タミル語', 'cs': 'チェコ語', 'ti': 'チグリニャ語', 'bo': 'チベット語', 'zh': '中国語', 'ts': 'ヅォンガ語', 'te': 'テルグ語', 'da': 'デンマーク 語', 'de': 'ドイツ語', 'tw': 'トウィ語', 'tk': 'トルクメン語', 'tr': 'トルコ語', 'to': 'トンガ語', 'na': 'ナウル語', 'ja': '日本語', 'ne': 'ネパール語', 'no': 'ノルウェー語', 'ht': 'ハイチ語', 'ha': 'ハウサ語', 'be': '白ロシア語', 'ba': 'バシキール語', 'ps': 'パシト語', 'eu': 'バスク語', 'hu': 'ハンガリー語', 'pa': 'パンジャビ語', 'bi': 'ビスラマ語', 'bh': 'ビハール語', 'my': 'ビルマ語', 'hi': 'ヒンディー語', 'fj': 'フィジー語', 'fi': 'フィンランド語', 'dz': 'ブータン語', 'fo': 'フェロー語', 'fr': 'フランス語', 'fy': 'フリジア語', 'bg': 'ブルガリア語', 'br': 'ブルターニュ語', 'vi': 'ベトナム語', 'iw': 'ヘブライ語', 'fa': 'ペルシャ語', 'bn': 'ベンガル語', 'pl': 'ポーランド語', 'pt': 'ポルトガル語', 'mi': 'マオリ語', 'mk': 'マカドニア語', 'mg': 'マダガスカル語', 'mr': 'マラッタ語', 'ml': 'マラヤーラム語', 'mt': 'マルタ語', 'ms': 'マレー語', 'mo': 'モルダビア語', 'mn': 'モンゴル語', 'yo': 'ヨルバ語', 'lo': 'ラオタ語', 'la': 'ラテン語', 'lv': 'ラトビア語', 'lt': 'リトアニア語', 'ln': 'リンガラ語', 'li': 'リンブルク語', 'ro': 'ルーマニア語', 'rm': 'レートロマンス語', 'ru': 'ロシア語'}

また、閲覧用に縦向きでは、(使用する場合は改行コードを削除してください)

lang_dict.py
{'en': '英語', 
 'und': '不明', 
 'is': 'アイスランド語', 
 'ay': 'アイマラ語', 
 'ga': 'アイルランド語', 
 'az': 'アゼルバイジェン語', 
 'as': 'アッサム語', 
 'aa': 'アファル語', 
 'ab': 'アプハジア語', 
 'af': 'アフリカーンス語', 
 'am': 'アムハラ語', 
 'ar': 'アラビア語', 
 'sq': 'アルバニア語', 
 'hy': 'アルメニア語', 
 'it': 'イタリア語', 
 'yi': 'イディッシュ語', 
 'iu': 'イヌクティトット語', 
 'ik': 'イヌピア語', 
 'ia': 'インターリングア', 
 'ie': 'インターリング語', 
 'in': 'インドネシア語', 
 'ug': 'ウイグル語', 
 'cy': 'ウェールズ語', 
 'vo': 'ヴォラピュック語', 
 'wo': 'ウォロフ語', 
 'uk': 'ウクライナ語', 
 'uz': 'ウズベク語', 
 'ur': 'ウルドゥー語', 
 'et': 'エストニア語', 
 'eo': 'エスペラント語', 
 'or': 'オーリア語', 
 'oc': 'オキタン語', 
 'nl': 'オランダ語', 
 'om': 'オロモ語', 
 'kk': 'カザフ語', 
 'ks': 'カシミール語', 
 'ca': 'カタラン語', 
 'gl': 'ガリシア語', 
 'ko': '韓国語', 
 'kn': 'カンナダ語', 
 'km': 'カンボジア語', 
 'rw': 'キヤーワンダ語', 
 'el': 'ギリシャ語', 
 'ky': 'キルギス語', 
 'rn': 'キルンディ語', 
 'gn': 'グアラニー語', 
 'qu': 'クエチュア語', 
 'gu': 'グジャラト語', 
 'kl': 'グリーンランド語', 
 'ku': 'クルド語', 
 'ckb': '中央クルド語', 
 'hr': 'クロアチア語', 
 'gd': 'ゲーリック語', 
 'gv': 'ゲーリック語', 
 'xh': 'コーサ語', 
 'co': 'コルシカ語', 
 'sm': 'サモア語', 
 'sg': 'サングホ語', 
 'sa': 'サンスクリット語', 
 'ss': 'シスワティ語', 
 'jv': 'ジャワ語', 
 'ka': 'ジョージア語', 
 'sn': 'ショナ語', 
 'sd': 'シンド語', 
 'si': 'シンハラ語', 
 'sv': 'スウェーデン語', 
 'su': 'スーダン語', 
 'zu': 'ズールー語', 
 'es': 'スペイン語', 
 'sk': 'スロヴァキア語', 
 'sl': 'スロヴェニア語', 
 'sw': 'スワヒリ語', 
 'tn': 'セツワナ語', 
 'st': 'セト語', 
 'sr': 'セルビア語', 
 'sh': 'セルボクロアチア語', 
 'so': 'ソマリ語', 
 'th': 'タイ語', 
 'tl': 'タガログ語', 
 'tg': 'タジク語', 
 'tt': 'タタール語', 
 'ta': 'タミル語', 
 'cs': 'チェコ語', 
 'ti': 'チグリニャ語', 
 'bo': 'チベット語', 
 'zh': '中国語', 
 'ts': 'ヅォンガ語', 
 'te': 'テルグ語', 
 'da': 'デンマーク 語', 
 'de': 'ドイツ語', 
 'tw': 'トウィ語', 
 'tk': 'トルクメン語', 
 'tr': 'トルコ語', 
 'to': 'トンガ語', 
 'na': 'ナウル語', 
 'ja': '日本語', 
 'ne': 'ネパール語', 
 'no': 'ノルウェー語', 
 'ht': 'ハイチ語', 
 'ha': 'ハウサ語', 
 'be': '白ロシア語', 
 'ba': 'バシキール語', 
 'ps': 'パシト語', 
 'eu': 'バスク語', 
 'hu': 'ハンガリー語', 
 'pa': 'パンジャビ語', 
 'bi': 'ビスラマ語', 
 'bh': 'ビハール語', 
 'my': 'ビルマ語', 
 'hi': 'ヒンディー語', 
 'fj': 'フィジー語', 
 'fi': 'フィンランド語', 
 'dz': 'ブータン語', 
 'fo': 'フェロー語', 
 'fr': 'フランス語', 
 'fy': 'フリジア語', 
 'bg': 'ブルガリア語', 
 'br': 'ブルターニュ語', 
 'vi': 'ベトナム語', 
 'iw': 'ヘブライ語', 
 'fa': 'ペルシャ語', 
 'bn': 'ベンガル語', 
 'pl': 'ポーランド語', 
 'pt': 'ポルトガル語', 
 'mi': 'マオリ語', 
 'mk': 'マカドニア語', 
 'mg': 'マダガスカル語', 
 'mr': 'マラッタ語', 
 'ml': 'マラヤーラム語', 
 'mt': 'マルタ語', 
 'ms': 'マレー語', 
 'mo': 'モルダビア語', 
 'mn': 'モンゴル語', 
 'yo': 'ヨルバ語', 
 'lo': 'ラオタ語', 
 'la': 'ラテン語', 
 'lv': 'ラトビア語', 
 'lt': 'リトアニア語', 
 'ln': 'リンガラ語', 
 'li': 'リンブルク語', 
 'ro': 'ルーマニア語', 
 'rm': 'レートロマンス語', 
 'ru': 'ロシア語'}

英語を先頭に、undというのは画像だけとか混ざっていて分からないなどの場合に使われています。

よく使われる言語は

![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/522233/2d3c3eed-d37f-a413-aaaa-1a067e0ab461.png) 92万ツイートを解析した際には、英語と日本語で52%に達していました。ほかに、地域ごとに色分けすると、 ![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/522233/0556e0eb-b670-70b4-dae9-60b6d7e8a038.png)

https://twitter.com/kenkensz9/status/1156926767140966400
https://twitter.com/kenkensz9/status/1156928680477655043

詳しくはこのあたりをご覧ください。ありがとうございました。

定型文
ツイッター(@kenkensz9)にいつもいるので何かあればどうぞ
よろしければいいねお願いします!

4
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?