文字種の判断
色々なところに、載っているけどメモ。
public static bool IsHiragana(string str) { return Regex.IsMatch(str, @"^\p{IsHiragana}+$"); } public static bool IsKatakana(string str) { return Regex.IsMatch(str, @"^\p{IsKatakana}+$"); } public static bool IsAlphabet(string str) { return Regex.IsMatch(str, @"^[a-zA-Z0-9]+$"); } public static bool IsSymbol(string str) { return Regex.IsMatch(str, @"^[!-@]+$"); } public static bool IsContainsSymbol(string str) { return Regex.IsMatch(str, @"[!-@]"); }
ひらがなと、カタカナとアルファベットと記号の判断。
これで、2日かけて予測変換の辞書を、Blogや論文から抽出するプログラムができました。