英数字とアンダースコアの正規表現

^ : start of string
[ : beginning of character group
a-z : any lowercase letter
A-Z : any uppercase letter
0-9 : any digit
_ : underscore
] : end of character group
* : zero or more of the given characters
$ : end of string

空の文字列を許可しない場合は、*の代わりに+を使用します。

EDIT 他の人が指摘したように、一部の正規表現言語には「[a-zA-Z0-9_]」の省略形があります。 .NET正規表現言語では、ECMAScriptの動作をオンにして、省略形として「\ w」を使用できます(「^\ w * $」または「^ \ w + $」を生成)。他の言語では、デフォルトでは.NETでは、 \ wはやや広く、他の種類のユニコード文字にも一致することに注意してください(これを指摘してくれたJanに感謝します)。したがって、これらの文字をのみ一致させるつもりなら、明示的な(長い)フォームを使用するのがおそらく最善です。

kch · Answer 2 · 2008-12-05T05:25:04+00:00

ここには多くの冗長性があり、私はそれに深く反対しているので、私の決定的な答えは次のとおりです。

/^\w+$/

\ wは [A-Za-z0-9_]と同等で、ほぼ必要なものです。 (ミックスにユニコードを導入しない限り)。

+数量詞を使用すると、1つ以上の文字が一致します。空の文字列も受け入れたい場合は、代わりに *を使用します。

Anton · Answer 3 · 2008-12-03T05:08:09+00:00

各文字が要件に一致することを確認したいため、以下を使用します。

[A-Za-z0-9_]

そして、あなたは省略バージョンを使用することもできます:

\w

これは同等です(一部の正規表現フレーバーでは、使用する前に確認してください)。次に、文字列全体が一致する必要があることを示すために、以下を使用します。

文字列を示すには、その文字で開始し、次に使用する必要があります。

文字列を示すには、その文字で終了する必要があります。次に使用します。

\w+ or \w*

「1以上」または「0以上」を示すため。それをすべてまとめると、次のようになります。

^\w*$

Day Davis Waterbury · Answer 4 · 2012-06-09T22:53:02+00:00

\ wよりも冗長ですが、POSIX文字の完全なクラス名(http://www.zytrax.com/tech/web/regex.htm#special)の読みやすさを個人的に高く評価しているので、次のように言います。。

^[[:alnum:]_]+$

ただし、上記のリンクのドキュメントには、「\ w」は「0-9、A-Z、a-zの範囲の任意の文字に一致する(POSIX [:alnum:]に相当)」と記載されていますが、これは本当であることがわかりました。とにかく「grep -P」ではありません。 [:alnum:]を使用する場合はアンダースコアを明示的に含める必要がありますが、\ wを使用する場合は含めないでください。あなたは短くて甘いもののために以下を倒すことはできません:

^\w+$

読みやすさとともに。, POSIX文字クラスを使用します。 (http://www.regular-expressions.info/posixbrackets.html。) つまり、正規表現が非ASCII文字列で機能する可能性があります。, 範囲ベースの正規表現が勝った&#39。;他の文字セットとは異なる可能性があるASCII文字の基礎となる順序に依存しているため、ASCII以外の文字は除外されます。 (&などの文字;#339。; キャプチャしたい場合があります。

BenAlabaster · Answer 5 · 2008-12-03T04:31:41+00:00

あの...質問です。少なくとも1文字は必要ですか、それとも必要ないですか？空文字列でもいいのでしょうか？

^[A-Za-z0-9_]+$

大文字、小文字の英数字、アンダースコアのうち、少なくとも1つは実行します。長さがゼロの場合は、+を*に置き換えるだけです。

^[A-Za-z0-9_]*$

編集する。

発音記号を含める必要がある場合（セディラ - ç など）、上記と同じように発音記号を含む単語文字を使用する必要があります。

^\w+$

または

^\w*$

Danuel O'Neal · Answer 6 · 2012-01-31T13:38:39+00:00

Computer Scienceでは、英数字の値は、多くの場合、最初の文字が数値ではなく、アルファベットまたはアンダースコアであることを意味します。その後、文字は「0-9」、「A-Z」、「a-z」、またはアンダースコア(「_」)になります。

これがあなたのやり方です:

php:でテストされています。

$regex = '/^[A-Za-z_][A-Za-z\d_]*$/'

またはこれを取る。

^[A-Za-z_][A-Za-z\d_]*$

それをあなたの開発言語に置いてください。

Drew Hall · Answer 7 · 2008-12-03T04:31:17+00:00

どうなんでしょうね。

^([A-Za-z]|[0-9]|_)+$

...露骨に言うなら、あるいは。

^\w+$

...簡潔（Perl構文）を好むなら。

boooloooo · Answer 8 · 2010-11-12T18:20:07+00:00

lookaheadsを使用して、「少なくとも1つ」の操作を行います。信じてください、それははるかに簡単です。

以下は、少なくとも1桁と1文字を含む1〜10文字を必要とする例です。

^(?=.*\d)(?=.*[A-Za-z])[A-Za-z0-9]{1,10}$

注:\ wを使用した可能性がありますが、ECMA / Unicodeの考慮事項が作用し、\ wの「単語文字」の文字カバレッジが増加します。

Shantanu · Answer 9 · 2012-01-11T00:52:41+00:00

文字列用に作成したこれらの多言語拡張子を試してください。

IsAlphaNumeric-文字列には、少なくとも1つのアルファ(charSetで指定されたUnicode範囲の文字)と少なくとも1つの数値(numSetで指定)が含まれている必要があります。また、文字列はアルファと数値のみで構成する必要があります。

IsAlpha-文字列には、少なくとも1つのアルファ(charSetで指定された言語)が含まれ、アルファのみで構成されている必要があります。

IsNumeric-文字列には少なくとも1つの数値(numSetで指定された言語)を含める必要があり、数値のみで構成されます。

目的の言語のcharSet / numSet範囲を指定できます。 Unicodeの範囲は、以下のリンクから入手できます。

http://www.ssec.wisc.edu/~tomw/java/unicode.html。

API:

    public static bool IsAlphaNumeric(this string stringToTest)
    {
        //English
        const string charSet = "a-zA-Z";
        const string numSet = @"0-9";

        //Greek
        //const string charSet = @"\u0388-\u03EF";            
        //const string numSet = @"0-9";

        //Bengali
        //const string charSet = @"\u0985-\u09E3";
        //const string numSet = @"\u09E6-\u09EF";

        //Hindi
        //const string charSet = @"\u0905-\u0963";
        //const string numSet = @"\u0966-\u096F";

        return Regex.Match(stringToTest, @"^(?=[" + numSet + @"]*?[" + charSet + @"]+)(?=[" + charSet + @"]*?[" + numSet + @"]+)[" + charSet + numSet +@"]+$").Success;
    }

    public static bool IsNumeric(this string stringToTest)
    {
        //English
        const string numSet = @"0-9";

        //Hindi
        //const string numSet = @"\u0966-\u096F";

        return Regex.Match(stringToTest, @"^[" + numSet + @"]+$").Success;
    }

    public static bool IsAlpha(this string stringToTest)
    {
        //English
        const string charSet = "a-zA-Z";

        return Regex.Match(stringToTest, @"^[" + charSet + @"]+$").Success;
    }

使用法:

        //English
        string test = "AASD121asf";

        //Greek
        //string test = "Ϡϛβ123";

        //Bengali
        //string test = "শর৩৮";

        //Hindi
        //string test = @"क़लम३७ख़";

        bool isAlphaNum = test.IsAlphaNumeric();

Jay · Answer 10 · 2008-12-03T04:31:51+00:00

以下の正規表現は、英数字とアンダースコアにマッチします。

^[a-zA-Z0-9_]+$

例えば、Perlの場合。

#!/usr/bin/perl -w

my $arg1 = $ARGV[0];

# check that the string contains *only* one or more alphanumeric chars or underscores
if ($arg1 !~ /^[a-zA-Z0-9_]+$/) {
  print "Failed.\n";
} else {
    print "Success.\n";
}

mylesmckeown · Answer 11 · 2010-06-24T09:25:57+00:00

私にとって、英数字と英数字を区別したいという問題があったので、英数字の文字列に少なくとも1つの英数字と少なくとも1つの数値が含まれていることを確認するために、以下を使用しました。

^([a-zA-Z_]{1,}\d{1,})+|(\d{1,}[a-zA-Z_]{1,})+$

mson · Answer 12 · 2008-12-03T04:44:06+00:00

以下は、少なくとも1文字、255文字以下を指定する数量詞で必要なものの正規表現です。

[^a-zA-Z0-9 _]{1,255}

Agustin · Answer 13 · 2012-04-03T14:57:40+00:00

unicode英数字のマッチングを探している人のために、次のようなことをしたいと思うかもしれません。

^[\p{L} \p{Nd}_]+$

さらに読む。 http://unicode.org/reports/tr18/。と。 http://www.regular-expressions.info/unicode.html。

Marcio Martins · Answer 14 · 2019-02-08T14:08:05+00:00

試合ではラテン語とUnicodeのキャラクターは使っていないと思います。たとえば、「ã」を取る必要がある場合または「ü」文字は、「\ w」の使用は機能しません。

または、次のアプローチを使用できます。

^[A-ZÀ-Ýa-zà-ý0-9_]+$

それが役立つことを願っています。!

David Norman · Answer 15 · 2008-12-03T04:33:10+00:00

文字列全体を確認し、空の文字列を許可しない場合は、試してください。

^[A-Za-z0-9_]+$

Saurabh · Answer 16 · 2015-05-20T13:02:51+00:00

Saurabh

20日 5月 2015 в 1:02

さらに

これはあなたが試すことができる私のために働きます。

[\\p{Alnum}_]

Paul Rooney

編集した答え 21日 8月 2019 в 2:02

0

Mukund · Answer 17 · 2017-11-14T15:50:30+00:00

Mukund

14日 11月 2017 в 3:50

さらに

^ \ w * $は以下の組み合わせで機能します。 。 1。 123。 1av。 pRo。 av1。 。

barbsan

編集した答え 21日 8月 2019 в 9:40

0