正規表現についてまとめました。
正規表現とは
文字列の並びをパターンで表現した記法のことです。
慣れてくると文字列検索や置換処理の時とても重宝します。
メタ文字の種類
詳しくまとめてある参考サイトはたくさんあると思いますので、詳しく知りたい人は調べてみてください。
ここでは個人的に良く使うものをまとめました。
| メタ文字 | 意味 | 正規表現 | 検索可能な文字列を含む行 |
|---|---|---|---|
| . | 任意の1文字 | これは.です | これは水です これは肉です |
| ^ | 行の先頭 | ^Windows | Windows 10 Windows 11 |
| $ | 行の末尾 | こんにちわ$ | 佐藤さん、こんにちわ 田中君、こんちにわ |
| * | 直前の文字が0文字以上 | abcde* | abcd abcdeeeeeee |
| + | 直前の文字が1文字以上 | すも+ | すもも すもももももももも |
| ? | 直前の文字が0文字 or 1文字 | Windows? | Window Windows |
| | | 左記で区切られた左側 or 右側の文字列 | フィリピン|シンガポール | 英語はフィリピンの公用語です 英語はシンガポールの公用語です |
| [] | 左記で囲まれた(”[“から”]”の間) いずれかの文字列 | [0-9] [a-z] [犬雉猿] | 0123456789 abcdefghijklmnopqrstuvwxyz 桃太郎のお供は犬です 桃太郎のお供は雉です 桃太郎のお供は猿です |
| [^] | 左記で囲まれた(”[^”から”]”の間) いずれかの文字列以外 | <p[^>]+> | <p id=”1″>a</p>b<p id=”2″>c</p> ※各開始タグがヒットする |
| () | 左記で囲まれた文字列をグループ化する | 私は(Windows|Mac)派です | 私はWindows派です 私はMac派です |
| {} | 直前の文字が左記で指定した範囲の数 | a{2}※2文字 b{2,}※2文字以上 c{2,4}※2文字~4文字 | aa bbbbbb・・・ cc ~ cccc |
| 量指定子? | 量指定子(”*”、”+”、”?”、”{}”) の後ろに”?”をつけると最短一致で検索 | <p .+?</p> | <p id=”1″>a</p>b<p id=”2″>c</p> ※最短一致だとbの前後を別々に扱う |
| \d | 半角数字 | \d | 0123456789 |
| \l | 半角英小文字 | \l | abcdefghijklmnopqrstuvwxyz |
| \u | 半角英大文字 | \u | ABCDEFGHIJKLMNOPQRSTUVWXYZ |
