1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

各国の文字列を扱う、"String"

Last updated at Posted at 2022-12-21

Symfony Component Advent Calendar 2022の22日目の記事です。

最初に

SymfonyはPHPのフレームワークのひとつです。しかし、公式サイトの説明文には

Symfony is a set of PHP Components, a Web Application framework, a Philosophy, and a Community — all working together in harmony.
(SymfonyはPHPコンポーネントのセットで、Webアプリケーションフレームワークで、哲学、そしてコミュニティです。それらがハーモニーを奏でながら動作しています。)

と書かれている通り、PHPコンポーネントのセットで、たくさんのコンポーネントを提供しており、それらを組み合わせてひとつのフレームワークとして動作しています。Symfonyのコンポーネントは、Symfony上だけで動作するのではなく、他のPHPフレームワークやアプリケーションでも動作している強力なものが揃っています。

今回はそれらの中から、役立ちそうなもの・お薦めしたいものを紹介していきたいと思います。

※記事内ではautoloadのインポートは省略します。

各国の文字列を扱う、"String"

Stringは、文字列を扱うコンポーネントです。各国の文字列を適切に扱います。

インストール

composer require symfony/string

バイト、コードポイント、書記素クラスタ

Stringコンポーネントを使うと、文字列をバイト、コードポイント、書記素クラスタごとに扱えるようになります。
それぞれは、ざっくり言うと以下のような扱いになります。

種類 内容
バイト 各文字コードのバイト
コードポイント Unicode
書記素クラスタ 実際の文字としてのUnicodeの組み合わせ

ぱっと見、ちょっとわからないですが、例えばनमस्ते(ナマステ)という文字の場合、UTF-8でバイト数は18バイトあります。
これをUnicodeにすると、6つのコードで構成されています。
しかしながら、文字数(書記素クラスタ)的には4文字になります。以下の図だとよりわかりやすいと思います。

文字列比較

このバイト、コードポイント、書記素クラスタごとにオブジェクトを作って、それぞれを扱えるようにできます。


use Symfony\Component\String\ByteString;
use Symfony\Component\String\CodePointString;
use Symfony\Component\String\UnicodeString;

$string = 'नमस्ते';

// バイト
$byteString = new ByteString($string);
echo $byteString->length(); // 18

// コードポイント
$codePointString = new CodePointString($string);
echo $codePointString->length(); // 6

// 書記素クラスタ
$unicodeString = new UnicodeString($string);
echo $unicodeString->length(); // 4

このように、それぞれの種類で文字列データを扱うことができます。もちろん日本語もOKです。
ただ、実際によく使うのは書記素クラスタになると思いますし、UnicodeStringにはたくさんの機能がついています。
その一部を紹介します。


use function Symfony\Component\String\u;

$unicodeString = u('文字列'); // new UnicodeString()と同一

echo u('ABCDE')->lower(); // 文字列を小文字にする 'abcde'

echo u('abcde')->upper(); // 大文字にする 'ABCDE'

echo u('my favorite framework')->title(); // タイトル文字列にする 'My favorite framework'
echo u('my favorite framework')->title(true); // 各スペース直後の文字を大文字に 'My Favorite Framework'

echo u('my favorite framework')->camel(); // キャメルケースに 'myFavoriteFramework'
echo u('my favorite framework')->snake(); // スネークケースに 'my_favorite_framework'

echo u('abc')->indexOf('B'); // 該当の文字があるかチェック(大文字小文字判断) null
echo u('abc')->ignoreCase()->indexOf('B') 該当の文字があるかチェック大文字小文字判断せず // 1

echo u('Item')->ensureStart('get'); // 指定した文字列でスタートする 'getItem'
echo u('getItem')->ensureStart('get'); // 指定した文字列がスタートしてたら何もしない 'getItem'
echo u('Item')->ensureEnd('Controller'); // 指定した文字列でおわる 'ItemController'
echo u('ItemController')->ensureEnd('Controller'); // 指定した文字列でおわってたら何もしない 'ItemController'

echo u(' hoge ')->trim(' '); // 指定の文字をトリム 'hoge'
echo u('my-hoge.png')->trimPrefix('my-'); // 前から指定の文字をトリム 'hoge.png'
echo u('my-hoge.png')->trimSuffix('.png'); // 後ろから指定の文字をトリム 'my-hoge'
echo u('my favorite framework')->truncate(5, '...'); // 指定した文字数で切る 'my fa...'

echo u('てんきがいいですね')->reverse(); // 反対にする 'ねすでいいがきんて'

echo u('abcde')->equalsTo('abcde'); // 文字列比較 true
echo u('abcde')->match('/b(.+)e$/'); // 正規表現で検索 ['bcde', 'cd', null]
echo u('abcde')->replace('bc', 'hi'); // 文字列置換 'ahide'
echo u('abcde')->replaceMatches('/bc/', 'hi'); // 正規表現で文字列置換 'ahide'

などなどあります。ensure***あたり、なんか役立ちそうな気がします。
ぜひ公式ドキュメントをご覧ください。

スラッグ

WordPressなどのCMSは、タイトルをそのままURLにすることがあります。StringではSluggerInterfaceを使って、スラッグを作成することができます。


use Symfony\Component\String\Slugger\AsciiSlugger;

$title = 'My favorite framework';

$slugger = new AsciiSlugger();
$slug = $slugger->slug($title);

echo $slug; // my-favorite-framework

$title = 'すきな フレームワーク';
$slug = $slugger->slug($title, 'ja'); // 言語指定可能(ただ、指定しなくても自動判別するっぽい)

echo $slug; // sukina-furemuwaku

絵文字置換

Symfony 6.2から、AsciiSlugger::withEmoji()を使うことで、タイトルに使われた絵文字を文字列に置換してスラッグをつくります。


$title = 'My favorite 🐈';

$slugger = new AsciiSlugger();
$slug = $slugger->withEmoji()->slug($title);

echo $slug; // my-favorite-neko

$slug = $slugger->withEmoji()->slug($title, 'en'); // 言語指定可能
echo $slug; // my-favorite-cat

Inflector

Inflectorを使うことで、文字列の単数系・複数形を取得できます。


use Symfony\Component\String\Inflector\EnglishInflector;

$inflector = new EnglishInflector();

// 単数系→複数形
print_r($inflector->pluralize('knife'); // ['knives']
print_r($inflector->pluralize('person'); // ['persons', 'people'] 複数ある場合は、それぞれを返す

// 複数形→単数系
print_r($inflector->singularize('geese'); // ['goose']
print_r($inflector->singularize('leaves') // ['leaf', 'leave', 'leaff'] 複数ある場合は、それぞれを返す

まとめ

今回はStringを紹介しました。特にUnicodeStringは普通にPHPの文字列関数を使うよりも便利という印象を受けました。
また、Slugger, Inflectorなども含め、何かしらメソッド名やクラス名、ファイル名などを生成するのに便利だと思います。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?