JavaScriptで正規表現(文字列置換え編)

  • 158
    いいね
  • 4
    コメント
この記事は最終更新日から1年以上が経過しています。

正規表現で文字列の置き換えを纏めてみました。

あまり自身ないんで、「おかしいよ」「こうした方がいいんじゃない」っていうのがあったらコメント下さい :smile:

なお、簡単なテストは通していますがすべてを網羅しているわけではありませんので、ご使用になる際にはご自身で十分検証の上ご利用下さい :bangbang:

/**
 * 改行をBRタグに変換
 * 
 * @param {String} str 変換したい文字列
 */
var nl2br = function (str) {
    return str.replace(/\n/g, '<br>');
};
/**
 * BRタグを改行に変換(BRの大文字・小文字の区別なし)
 * 
 * @param {String} str 変換したい文字列
 */
var br2nl = function (str) {
    return str.replace(/(<br>|<br \/>)/gi, '\n');
};
/**
 * タブをnum文字のスペースに変換
 * 
 * @param {String} str 変換したい文字列
 * @param {Number} num スペースの文字数(デフォルトは4)
 */
var tab2space = function (str, num) {
    num = parseInt(num, 10);
    var space = new Array(isNaN(num) ? 5 : num + 1).join(' ');
    return str.replace(/\t/g, space);
};
/**
 * スネークケースからキャメルケースに変換
 *
 * アンダースコア、ハイフン、半角スペースを変換
 * 先頭の区切り文字は削除
 * 変換前にある文字列中の大文字は変換されないので注意
 *
 * 「abc-def」→「abcDef」
 * 「abc-dEF」→「abcDEF」(変換前の大文字はそのまま)
 * 
 * @param {String} str 変換したい文字列
 * @param {Boolean} upper アッパーキャメルケースにするかどうか
 */
var snake2camel = function (str, upper) {
    str = str
            .replace(/^[\-_ ]/g, "")
            .replace(/[\-_ ]./g, function (match) {
                return match.charAt(1).toUpperCase();
            });
    return upper === true ?
            str.replace(/^[a-z]/g, function (match) {
                return match.toUpperCase();
            }) : str;
};
/**
 * キャメルケースからスネークケースに変換
 * 
 * 先頭の連続した大文字は大文字の最後尾とそれ以外に分解される
 * 最後尾の連続した大文字はひとつのまとまりとして変換される
 *
 * ABCDEF → abcdef
 * abcDef → abc-def
 * AbcDef → abc-def
 * DEFClass → def-class(先頭の連続した大文字は分解)
 * classID → class-id(最後尾の連続した大文字はひとつのまとまりとして変換)
 * 
 * @param {String} str 変換したい文字列
 * @param {String} separator 区切り文字(デフォルトはハイフン)
 */
var camel2snake = function (str, separator) {
    separator = separator === undefined ? "-" : separator;
    return str
            .replace(/^[A-Z]+$/, function (match) {
                return match.toLowerCase();
            })
            .replace(/^[A-Z]+/, function (match) {
                if (match.length > 1) {
                    return match.replace(/[A-Z]$/, function (m) {
                        return separator + m.toLowerCase();
                    }).toLowerCase();
                } else {
                    return match.toLowerCase();
                }
            })
            .replace(/[A-Z]+$/g, function (match) {
                return separator + match.toLowerCase();
            })
            .replace(/[A-Z]/g, function (match) {
                return separator + match.toLowerCase();
            });
};

scivolaさんのご指摘により「hira2kana」の変換範囲を「ぁ-ゔ」に変更
「ゕ」「ゖ」の変換をオプションで選択

/**
 * ひらがなを全角カタカナに変換
 * 
 * 濁音・半濁音のある場合一文字に変換するかは今後の課題
 *
 * 以下の文字は結合してカタカナに変換
 * 「う゛」→「ヴ」
 * 「わ゛」→「ヷ」
 * 「ゐ゛」→「ヸ」
 * 「ゑ゛」→「ヹ」
 * 「を゛」→「ヺ」
 * 「ゝ゛」→「ヾ」
 * 
 * @param {String} str 変換したい文字列
 * @param {Boolean} opt 小文字の「ゕ」「ゖ」を変換するかどうか falseを指定した場合は変換なし
 */
var hira2kana = function (str, opt) {
    str = str
            .replace(/[ぁ-ゔ]/g, function (s) {
                return String.fromCharCode(s.charCodeAt(0) + 0x60);
            })
            .replace(/゙/g, '゛')
            .replace(/゚/g, '゜')
            .replace(/(ウ゛)/g, 'ヴ')
            .replace(/(ワ゛)/g, 'ヷ')
            .replace(/(ヰ゛)/g, 'ヸ')
            .replace(/(ヱ゛)/g, 'ヹ')
            .replace(/(ヲ゛)/g, 'ヺ')
            .replace(/(ゝ゛)/g, 'ヾ')
            .replace(/ゝ/g, 'ヽ')
            .replace(/ゞ/g, 'ヾ');
    if (opt !== false) {
        str = str.replace(/ゕ/g, 'ヵ').replace(/ゖ/g, 'ヶ');
    }
    return str;
};

scivolaさんのご指摘により「kana2hira」の変換範囲を「ァ-ヴ」に変更
「ヵ」「ヶ」の変換をオプションで選択

/**
 * 全角カタカナをひらがなに変換
 * 
 * 濁音・半濁音のある場合一文字に変換するかは今後の課題
 *
 * 以下の文字を結合・展開
 * 「ウ゛」→「ゔ」
 * 「ヷ」→「わ゛」
 * 「ヸ」→「ゐ゛」
 * 「ヹ」→「ゑ゛」
 * 「ヺ」→「を゛」
 * 「ヽ゛」→「ゞ」
 *
 * ひらがなに無いカタカナは変換しない
 * 「ㇰ」「ㇱ」「ㇲ」「ㇳ」「ㇴ」「ㇵ」「ㇶ」「ㇷ」
 * 「ㇸ」「ㇹ」「ㇺ」「ㇻ」「ㇼ」「ㇽ」「ㇾ」「ㇿ」
 * 
 * @param {String} str 変換したい文字列
 * @param {Boolean} opt 小文字の「ヵ」「ヶ」を変換するかどうか falseを指定した場合は変換なし
 */
var kana2hira = function (str) {
    str = str
            .replace(/[ァ-ヴ]/g, function (s) {
                return String.fromCharCode(s.charCodeAt(0) - 0x60);
            })
            .replace(/゙/g, '゛')
            .replace(/゚/g, '゜')
            .replace(/(う゛)/g, 'ゔ')
            .replace(/ヷ/g, 'わ゛')
            .replace(/ヸ/g, 'ゐ゛')
            .replace(/ヹ/g, 'ゑ゛')
            .replace(/ヺ/g, 'を゛')
            .replace(/(ヽ゛)/g, 'ゞ')
            .replace(/ヽ/g, 'ゝ')
            .replace(/ヾ/g, 'ゞ');
    if (opt !== false) {
        str = str.replace(/ヵ/g, 'ゕ').replace(/ヶ/g, 'ゖ');
    }
    return str;
};

scivolaさんのご指摘により「hankana2zenkana」の対応表を変更

/**
 * 半角カタカナを全角カタカナに変換
 * 
 * @param {String} str 変換したい文字列
 */
var hankana2zenkana = function (str) {
    var kanaMap = {
        'ガ': 'ガ', 'ギ': 'ギ', 'グ': 'グ', 'ゲ': 'ゲ', 'ゴ': 'ゴ',
        'ザ': 'ザ', 'ジ': 'ジ', 'ズ': 'ズ', 'ゼ': 'ゼ', 'ゾ': 'ゾ',
        'ダ': 'ダ', 'ヂ': 'ヂ', 'ヅ': 'ヅ', 'デ': 'デ', 'ド': 'ド',
        'バ': 'バ', 'ビ': 'ビ', 'ブ': 'ブ', 'ベ': 'ベ', 'ボ': 'ボ',
        'パ': 'パ', 'ピ': 'ピ', 'プ': 'プ', 'ペ': 'ペ', 'ポ': 'ポ',
        'ヴ': 'ヴ', 'ヷ': 'ヷ', 'ヺ': 'ヺ',
        'ア': 'ア', 'イ': 'イ', 'ウ': 'ウ', 'エ': 'エ', 'オ': 'オ',
        'カ': 'カ', 'キ': 'キ', 'ク': 'ク', 'ケ': 'ケ', 'コ': 'コ',
        'サ': 'サ', 'シ': 'シ', 'ス': 'ス', 'セ': 'セ', 'ソ': 'ソ',
        'タ': 'タ', 'チ': 'チ', 'ツ': 'ツ', 'テ': 'テ', 'ト': 'ト',
        'ナ': 'ナ', 'ニ': 'ニ', 'ヌ': 'ヌ', 'ネ': 'ネ', 'ノ': 'ノ',
        'ハ': 'ハ', 'ヒ': 'ヒ', 'フ': 'フ', 'ヘ': 'ヘ', 'ホ': 'ホ',
        'マ': 'マ', 'ミ': 'ミ', 'ム': 'ム', 'メ': 'メ', 'モ': 'モ',
        'ヤ': 'ヤ', 'ユ': 'ユ', 'ヨ': 'ヨ',
        'ラ': 'ラ', 'リ': 'リ', 'ル': 'ル', 'レ': 'レ', 'ロ': 'ロ',
        'ワ': 'ワ', 'ヲ': 'ヲ', 'ン': 'ン',
        'ァ': 'ァ', 'ィ': 'ィ', 'ゥ': 'ゥ', 'ェ': 'ェ', 'ォ': 'ォ',
        'ッ': 'ッ', 'ャ': 'ャ', 'ュ': 'ュ', 'ョ': 'ョ',
        '。': '。', '、': '、', 'ー': 'ー', '「': '「', '」': '」', '・': '・'
    };

    var reg = new RegExp('(' + Object.keys(kanaMap).join('|') + ')', 'g');
    return str
            .replace(reg, function (match) {
                return kanaMap[match];
            })
            .replace(/゙/g, '゛')
            .replace(/゚/g, '゜');
};
/**
 * 全角から半角に置き換え
 *
 * 全角チルダ、全角波ダッシュ共に半角チルダに変換
 * 全角ハイフン、全角ダッシュ、全角マイナス記号は半角ハイフンに変換
 * 長音符は半角ハイフンに含めない(住所の地名等に使用される為)
 *
 * 今は良いがUnicode 8.0で波ダッシュの形が変わるみたいなので、波ダッシュを変換に
 * 含めるべきかどうかは検討が必要
 *
 * @param {String} str 変換したい文字列
 * @param {Boolean} tilde チルダ falseを指定した場合は変換なし
 * @param {Boolean} mark 記号 falseを指定した場合は変換なし
 * @param {Boolean} hankana 半角カナ記号 trueを指定した場合のみ変換
 * @param {Boolean} space スペース falseを指定した場合は変換なし
 * @param {Boolean} alpha 英字 falseを指定した場合は変換なし
 * @param {Boolean} num 数字 falseを指定した場合は変換なし
 */
var zen2han = function (str, tilde, mark, hankana, space, alpha, num) {
    if (alpha !== false) {
        str = str.replace(/[A-Za-z]/g, function (s) {
            return String.fromCharCode(s.charCodeAt(0) - 65248);
        });
    }
    if (num !== false) {
        str = str.replace(/[0-9]/g, function (s) {
            return String.fromCharCode(s.charCodeAt(0) - 65248);
        });
    }
    if (mark !== false) {
        var reg = /[!"#$%&'()*+,-./:;<=>?@[\]^_`{|}]/g;
        str = str.replace(reg, function (s) {
            return String.fromCharCode(s.charCodeAt(0) - 65248);
        }).replace(/[‐-―]/g, '-');
    }
    if (tilde !== false) {
        str = str.replace(/[~〜]/g, '~');
    }
    if (space !== false) {
        str = str.replace(/ /g, ' ');
    }
    if (hankana === true) {
        var map = {'。': '。', '、': '、', '「': '「', '」': '」', '・': '・'};
        var reg = new RegExp('(' + Object.keys(map).join('|') + ')', 'g');
        str = str.replace(reg, function (match) {
            return map[match];
        });
    }
    return str;
};
/**
 * 半角から全角に置き換え
 *
 * チルダは全角チルダに変換
 * 
 * @param {String} str 変換したい文字列
 * @param {Boolean} tilde チルダ falseを指定した場合は変換なし
 * @param {Boolean} mark 記号 falseを指定した場合は変換なし
 * @param {Boolean} hankana 半角カナ記号 falseを指定した場合は変換なし
 * @param {Boolean} space スペース falseを指定した場合は変換なし
 * @param {Boolean} alpha 英字 falseを指定した場合は変換なし
 * @param {Boolean} num 数字 falseを指定した場合は変換なし
 */
var han2zen = function (str, tilde, mark, hankana, space, alpha, num) {
    if (alpha !== false) {
        str = str.replace(/[A-Za-z]/g, function (s) {
            return String.fromCharCode(s.charCodeAt(0) + 65248);
        });
    }
    if (num !== false) {
        str = str.replace(/\d/g, function (s) {
            return String.fromCharCode(s.charCodeAt(0) + 65248);
        });
    }
    if (mark !== false) {
        var reg = /[!"#\$%&'\(\)\*\+,\-\.\/:;<=>\?@\[\\\]\^_`\{\|\}]/g;
        str = str.replace(reg, function (s) {
            return String.fromCharCode(s.charCodeAt(0) + 65248);
        });
    }
    if (tilde !== false) {
        str = str.replace(/~/g, '~');
    }
    if (space !== false) {
        str = str.replace(/ /g, ' ');
    }
    if (hankana !== false) {
        var map = {'。': '。', '、': '、', '「': '「', '」': '」','・': '・'};
        var reg = new RegExp('(' + Object.keys(map).join('|') + ')', 'g');
        str = str.replace(reg, function (match) {
            return map[match];
        });
    }
    return str;
};
/**
 * 一文字で表記される文字を複数文字に展開する
 * 会社名等を入力する欄でこれは入れないでほしいな~と思う文字
 *
 * @param {String} str 変換する文字列
 */
one2multi: function (str) {
    var map = {
        '㈱': '(株)', '㈲': '(有)', '㈳': '(社)', '㈵': '(特)',
        '㈶': '(財)', '㈻': '(学)', '㈼': '(監)', '㍿': '株式会社'
    };
    var reg = new RegExp('(' + Object.keys(map).join('|') + ')', 'g');
    return str.replace(reg, function (match) {
        return map[match];
    });
}