Paradigm Shift Design

ISHITOYA Kentaro's blog.

文字種の判断

色々なところに、載っているけどメモ。

        public static bool IsHiragana(string str)
        {
            return Regex.IsMatch(str, @"^\p{IsHiragana}+$");
        }

        public static bool IsKatakana(string str)
        {
            return Regex.IsMatch(str, @"^\p{IsKatakana}+$");
        }

        public static bool IsAlphabet(string str)
        {
            return Regex.IsMatch(str, @"^[a-zA-Z0-9]+$");
        }

        public static bool IsSymbol(string str)
        {
            return Regex.IsMatch(str, @"^[!-@]+$");
        }

        public static bool IsContainsSymbol(string str)
        {
            return Regex.IsMatch(str, @"[!-@]");
        }

ひらがなと、カタカナとアルファベットと記号の判断。
これで、2日かけて予測変換の辞書を、Blogや論文から抽出するプログラムができました。