0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

PDFからテキストをコピペしたら一部が部首になっていた問題

Last updated at Posted at 2021-01-12

・・・タイトルが意味不明だけど。

受け取ったPDFからテキストをテキストエディタ(EmEditor)にコピペしたら、文字がおかしい。「目」や「止」がパッと見似ているけれどちょっと小さい。なんだこりゃ。

調べてみたら、PDFへ出力する時に発生する問題とのこと。
ExcelやWord(主にMac版?)からPDFへ出力するときに生じることが多いようだ。

漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」
https://techracho.bpsinc.jp/hachi8833/2020_10_07/95257

一括置換できる方法を探したけれど、結局、目視で最終確認が必要そうだったので、発行元に元データ(excel)を再送してもらった。

念のため元データからテキストを抜き出し、「康熙部首」や「CJK部首補助」が含まれているかどうかをチェック(下記を利用させてもらった)。問題なしということで無事解決。

日本語の文章のタイポ/変換ミス/誤字脱字エラーをチェック/校正
https://enno.jp/check

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?