なんか見たので。
データ取得
解析
このような些末な解析、AI 様の手を煩わせるまでもありません。私の手打ちコードにお任せください。
import jaconv
with open('input.csv',mode='r',encoding='utf-8') as f:
for line in f.read().split('\n'):
line = jaconv.h2z(line,digit=True,ascii=True)
n = len(line)
for level in range(1,n+1):
for left in range(0,n):
if left+level > n:
break
prefix = line[left:left+level]
for right in range(left+level,n):
if right+level > n:
break
suffix = line[right:right+level]
if prefix == suffix and level >= 2:
print(f'{line[:left]}「{line[left:left+level]}」{line[left+level:right]}「{line[right:right+level]}」{line[right+level:n]}')
結果
キ「ョウ」ゴクチ「ョウ」
キ「ョウ」ワチ「ョウ」
オ「ウシ」ュ「ウシ」
ヒガ「シマ」ツ「シマ」シ
「キタ」ア「キタ」シ
コ「ウシ」ュ「ウシ」
シ「ョウ」ワチ「ョウ」
アイシ「ョウ」チ「ョウ」
キ「ョウ」タンバチ「ョウ」
「ヤマ」トコオリ「ヤマ」シ
サトシ「ョウ」チ「ョウ」
シ「ョウ」オウチ「ョウ」
トノシ「ョウ」チ「ョウ」
シ「ョウ」ドシマチ「ョウ」
キタキ「ュウ」シ「ュウ」シ
キタキュ「ウシ」ュ「ウシ」
キタキ「ュウシ」「ュウシ」
キジ「ョウ」チ「ョウ」
ミナミキ「ュウ」シ「ュウ」シ
ミナミキュ「ウシ」ュ「ウシ」
ミナミキ「ュウシ」「ュウシ」
わかったこと
最大被りは、「北九州市」及び「南九州市」における「ゅうし」の $3$ 文字。
語呂が良いやつ
- しましまの市、ひがしまつしまし
- きたきたの市、きたあきたし
- やまやまの市、やまとこおりやまし