sedの正規表現で「\w」「\d」「\s」を実現する方法

sedの正規表現で「\w」「\d」「\s」を実現する方法

Posted at December 5,2014 1:11 AM
Tag:[bash, Linux, sed]

sedの正規表現で「\w」「\d」「\s」を実現する方法を紹介します。

sedの正規表現で「\w」「\d」「\s」を実現

1.問題点

sedの正規表現では、Perlなどで使われる英数またはアンダーバーにマッチする「\w」や「\d」、あるいは空白にマッチする「\s」などのメタ文字を使うことができません。

たとえば次のスクリプトで変数dataから「123」という値を取得しようとしても、期待通りの結果になりません。

#!/bin/sh
data="abc123def"
result=`echo "$data" | sed -e "s/^.*\(\d\{3\}\).*$/\1/"`
echo $result

ということで、メタ文字と同じ効果を得られる方法を紹介します。

2.sedの正規表現で「\w」「\d」「\s」を使う

sedの正規表現で「\w」「\d」「\s」などを実現するには、次の正規表現に置き換えます。

マッチ方法Perlsed
数字にマッチ\d[0-9]
数字以外の文字にマッチ\D[^0-9]
アルファベット、数字、アンダーバーにマッチ\w[a-zA-Z_0-9]
アルファベット、数字、アンダーバー以外の文字にマッチ\W[^a-zA-Z_0-9]
空白文字にマッチ\s[ \f\n\r\t]
空白文字以外にマッチ\S[^ \f\n\r\t]

たとえば、冒頭のサンプルは次のように変更することで期待通りの結果になります。

#!/bin/sh
data="abc123def"
result=`echo "$data" | sed -e "s/^.*\([0-9]\{3\}\).*$/\1/"`
echo $result

なお、連続スペースは

[ ]*

で表現できます。

[ ]+

では期待通りの動作になりません。

また、sedでは次の記号を円マークでエスケープする必要があるので注意してください。

意味Perlsed
グループ化(foo)\(foo\)
直前の文字の0個または1個にマッチ?\?
直前の文字の1個以上にマッチ+\+
直前の文字のm個にマッチ{m}\{m\}\d
関連記事
トラックバックURL


コメントする
greeting

*必須

*必須(非表示)


ご質問のコメントの回答については、内容あるいは多忙の場合、1週間以上かかる場合があります。また、すべてのご質問にはお答えできない可能性があります。予めご了承ください。

太字イタリックアンダーラインハイパーリンク引用
[サインインしない場合はここにCAPTCHAを表示します]

コメント投稿後にScript Errorや500エラーが表示された場合は、すぐに再送信せず、ブラウザの「戻る」ボタンで一旦エントリーのページに戻り(プレビュー画面で投稿した場合は、投稿内容をマウスコピーしてからエントリーのページに戻り)、ブラウザをリロードして投稿コメントが反映されていることを確認してください。

コメント欄に(X)HTMLタグやMTタグを記述される場合、「<」は「&lt;」、「>」は「&gt;」と入力してください。例えば「<$MTBlogURL$>」は「&lt;$MTBlogURL$&gt;」となります(全て半角文字)