正規表現

正規表現についてまとめました。

正規表現とは

文字列の並びをパターンで表現した記法のことです。
慣れてくると文字列検索や置換処理の時とても重宝します。

メタ文字の種類

詳しくまとめてある参考サイトはたくさんあると思いますので、詳しく知りたい人は調べてみてください。
ここでは個人的に良く使うものをまとめました。

メタ文字意味正規表現検索可能な文字列を含む行
.任意の1文字これは.です
これは水です
これは肉です
^行の先頭^WindowsWindows 10
Windows 11
$行の末尾こんにちわ$佐藤さん、こんにちわ
田中君、こんちにわ
*直前の文字が0文字以上abcde*abcd
abcdeeeeeee
+直前の文字が1文字以上すも+すもも
すもももももももも
?直前の文字が0文字 or 1文字Windows?Window
Windows
|左記で区切られた左側 or 右側の文字列フィリピン|シンガポール英語はフィリピンの公用語です
英語はシンガポールの公用語です
[]左記で囲まれた(”[“から”]”の間)
いずれかの文字列
[0-9]
[a-z]
[犬雉猿]
0123456789
abcdefghijklmnopqrstuvwxyz
桃太郎のお供は犬です
桃太郎のお供は雉です
桃太郎のお供は猿です
[^]左記で囲まれた(”[^”から”]”の間)
いずれかの文字列以外
<p[^>]+><p id=”1″>a</p>b<p id=”2″>c</p>
※各開始タグがヒットする
()左記で囲まれた文字列をグループ化する私は(Windows|Mac)派です私はWindows派です
私はMac派です
{}直前の文字が左記で指定した範囲の数a{2}※2文字
b{2,}※2文字以上
c{2,4}※2文字~4文字
aa
bbbbbb・・・
cc ~ cccc
量指定子?量指定子(”*”、”+”、”?”、”{}”)
の後ろに”?”をつけると最短一致で検索
<p .+?</p><p id=”1″>a</p>b<p id=”2″>c</p>
※最短一致だとbの前後を別々に扱う
\d半角数字\d0123456789
\l半角英小文字\labcdefghijklmnopqrstuvwxyz
\u半角英大文字\uABCDEFGHIJKLMNOPQRSTUVWXYZ