import pandas as pd
from flashtext import KeywordProcessor
# keyword指定
keyword_dict = {
'front': ['html', 'javascript','css'],
'back': ['php','python','ruby'],
'db': ['mysql','postgress','mongo']
}
# init
keyword_processor = KeywordProcessor()
# keyword追加
keyword_processor.add_keywords_from_dict(keyword_dict)
# サンプルcsv読み込み
df = pd.read_csv("sample.csv")
# カウント処理。各カウントした数を表示するカラム追加。
# 例 : sample.csv内の「contents」カラム内にあるデータに対して、各マッチング。
df['all_count'] = df['contents'].apply(lambda x: len(keyword_processor.extract_keywords(x)))
# 最初の3行出力
df.head(3)