概要
データ分析・予測において、文字列をInt型に変換して、データ可視化判斷からの分類・予測等に使用できればと、、、、
実行環境
macOS Monterey 12.1
python 3.8.12
実行プログラム
StringToInteger.py
import argparse
# 文字列をint型に変換
def str_to_int(s):
strint = int((s.encode('utf-8')).hex(), 16)
print("\t str_to_int : {0}".format(strint))
# print(type(strint))
# メイン
if __name__ == '__main__':
parser = argparse.ArgumentParser(description='引数の文字列を Hex型 と Int型 に変換する')
parser.add_argument('-s', '--str', type=str, required=True, help='文字列(例:メールアドレス)')
args = parser.parse_args()
print("\n 変換対象文字列 : {0}".format(args.str))
str_to_int(args.str)
print("")
プログラムのHELP表示
$ python StringToInteger.py -h
usage: StringToInt.py [-h] -s STR
引数の文字列を Hex型 と Int型 に変換する
optional arguments:
-h, --help show this help message and exit
-s STR, --str STR 文字列(例:メールアドレス)
プログラムの実行
## 文字列にメールアドレスを定義
$ python StringToInteger.py -s hoge@hoge.local
変換対象文字列 : hoge@hoge.local
str_to_int : 542258412590216803575412933219541356
## 文字列に日本語を定義
$ python StringToInteger.py -s 山田太郎
変換対象文字列 : 山田太郎
str_to_int : 71086887249939475064926339982
まとめ
変換することにより、機械学習等で利用できないかと、、、、、厳しいですかね、、、、