Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
4
Help us understand the problem. What is going on with this article?
@b2bmakers

CSVデータをPythonでまとめて全角半角処理

カタカナや記号、アルファベットや数字の全角や半角がまじったデータを、統一したい...となったときにする方法。

参考:

面倒なので、CSVをpandasで開いたときに、カラムごとに全角半角処理できるよう関数化しました。
columns = [] のリストにカラム名を入れるだけでOKなようにしています。

処理するもの:
カタカナ、記号(スペースとか)、数字をすべて半角にする。


#pip install jaconvを予めターミナルやコマンドラインツールでしておく。
import jaconv


def shori(column):
    list=  df[column].values.tolist()
    new_list = []

    for li in list:
        li = jaconv.z2h(li,digit=True, ascii=True,kana=True)
        new_list.append(li)

    df[column] = new_list

    return df[column]

##処理したいしたいカラム名をリストに入れます。
columns = []

#forで回します。
for column in columns:
    shori(column)

#strじゃないとエラーが出るときも。そんなときは
df = df.astype(str)

4
Help us understand the problem. What is going on with this article?
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
b2bmakers
大学で文学部独文学専攻というゴリゴリの文系にいた20代女子が、ひょんなことからHTML、CSS、Python、ディープラーニングなどに足をつっこむように。プログラミングって聞くと鳥肌が立ってしまう、数字をみるとめまいがしてしまうような、そんなゴリゴリの文系の方に向けて文系チックに書いています。個人ではライティングや編集をしています。

Comments

No comments
Sign up for free and join this conversation.
Sign Up
If you already have a Qiita account Login
4
Help us understand the problem. What is going on with this article?