海阔天空

I'm on my way!
随笔 - 17, 文章 - 69, 评论 - 21, 引用 - 0
数据加载中……

一个正则表达式工具类

一个java正规表达式工具类
类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 apache网站下下载

在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧.

这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的都写了):
匹配图象; 2 匹配email地址; 3 匹配匹配并提取url ; 4 匹配并提取http ;
匹配日期 6 匹配电话; 7 匹配身份证 8 匹配邮编代码
不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 即空格,制表符,回车符等

10 匹配非负整数(正整数 + 0) 11 匹配不包括零的非负整数(正整数 > 0)

12 匹配正整数 13 匹配非正整数(负整数 + 0)

14 匹配负整数; 15. 匹配整数 ;

16 匹配非负浮点数(正浮点数 + 0) 17. 匹配正浮点数

18 匹配非正浮点数(负浮点数 + 0) 19 匹配负浮点数;

20 .匹配浮点数; 21. 匹配由26个英文字母组成的字符串;
匹配由26个英文字母的大写组成的字符串 23 匹配由26个英文字母的小写组成的字符串

24 匹配由数字和26个英文字母组成的字符串; 25 匹配由数字、26个英文字母或者下划线组成的字符串;
Java代码
   1. java 代码   
   
2import java.util.*;  
   
3import org.apache.oro.text.regex.*;  
   
4.   
   
5/** 
   6.  * 类简介: 使用正则表达式验证数据或提取数据,类中的方法全为静态的 主要方法:1. isHardRegexpValidate(String source, 
   7.  * String regexp) 
   8.  *  
   9.  *  
  10.  * 区分大小写敏感的正规表达式批配 2. isSoftRegexpValidate(String source, String regexp) 
  11.  * 不区分大小写的正规表达式批配 3. getHardRegexpMatchResult(String source, String regexp) 
  12.  * 返回许要的批配结果集(大小写敏感的正规表达式批配) 4. getSoftRegexpMatchResult(String source, String 
  13.  * regexp) 返回许要的批配结果集(不区分大小写的正规表达式批配) 5 getHardRegexpArray(String source, String 
  14.  * regexp) 返回许要的批配结果集(大小写敏感的正规表达式批配) 6. getSoftRegexpMatchResult(String source, 
  15.  * String regexp) 返回许要的批配结果集(不区分大小写的正规表达式批配) 7. getBetweenSeparatorStr(final 
  16.  * String originStr,final char leftSeparator,final char rightSeparator) 
  17.  * 得到指定分隔符中间的字符串的集合 
  18.  *  
  19.  * @mail <A href="mailto:wuzhi2000@hotmail.com">wuzhi2000@hotmail.com</A> 
  20.  * 
@author ygj 
  21.  *  
  22.  
*/  
  
23public final class Regexp {  
  
24.   /** 保放有四组对应分隔符 */  
  
25.   static final Set SEPARATOR_SET = new TreeSet();  
  
26.   {  
  
27.     SEPARATOR_SET.add("(");  
  
28.     SEPARATOR_SET.add(")");  
  
29.     SEPARATOR_SET.add("[");  
  
30.     SEPARATOR_SET.add("]");  
  
31.     SEPARATOR_SET.add("{");  
  
32.     SEPARATOR_SET.add("}");  
  
33.     SEPARATOR_SET.add("<");  
  
34.     SEPARATOR_SET.add(">");  
  
35.   }  
  
36.   /** 存放各种正规表达式(以key->value的形式) */  
  
37.   public static HashMap regexpHash = new HashMap();  
  
38.   /** 存放各种正规表达式(以key->value的形式) */  
  
39.   public static List matchingResultList = new ArrayList();  
  
40.   
  
41.   private Regexp() {  
  
42.   }  
  
43.   
  
44.   /** 
  45.    * 返回 Regexp 实例 
  46.    *  
  47.    * 
@return 
  48.    
*/  
  
49.   public static Regexp getInstance() {  
  
50.     return new Regexp();  
  
51.   }  
  
52.   
  
53.   /** 
  54.    * 匹配图象 
  55.    *  
  56.    * 格式: /相对路径/文件名.后缀 (后缀为gif,dmp,png) 
  57.    *  
  58.    * 匹配 : /forum/head_icon/admini2005111_ff.gif 或 admini2005111.dmp 
  59.    *  
  60.    * 不匹配: c:/admins4512.gif 
  61.    *  
  62.    
*/  
  
63.   public static final String icon_regexp = "^(/{0,1}\\w){1,}\\.(gif|dmp|png|jpg)$|^\\w{1,}\\.(gif|dmp|png|jpg)$";  
  
64.   /** 
  65.    * 匹配email地址 
  66.    *  
  67.    * 格式: <A href="mailto:XXX@XXX.XXX.XX">XXX@XXX.XXX.XX</A> 
  68.    *  
  69.    * 匹配 : <A href="mailto:foo@bar.com">foo@bar.com</A> 或 < A href="mailto:foobar@foobar.com.au">foobar@foobar.com.au</A> 
  70.    *  
  71.    * 不匹配: foo@bar 或 $$$@bar.com 
  72.    *  
  73.    
*/  
  
74.   public static final String email_regexp = "(?:\\w[-._\\w]*\\w@\\w[-._\\w]*\\w\\.\\w{2,3}$)";  
  
75.   /** 
  76.    * 匹配匹配并提取url 
  77.    *  
  78.    * 格式: XXXX://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX 
  79.    *  
  80.    * 匹配 : <A href="
http://www.suncer.com" target=_blank>http://www.suncer.com</A> 或news://www 
  81.    *  
  82.    * 提取(MatchResult matchResult=matcher.getMatch()): matchResult.group(0)= 
  83.    * <A href="
http://www.suncer.com:8080/index.html?login=true" target=_blank>http://www.suncer.com:8080/index.html?login=true</A> matchResult.group(1) = 
  84.    * http matchResult.group(2) = <A href="www.suncer.com" target=_blank>www.suncer.com</A> matchResult.group(3) = :8080 
  85.    * matchResult.group(4) = /index.html?login=true 
  86.    *  
  87.    * 不匹配: c:\window 
  88.    *  
  89.    
*/  
  
90.   public static final String url_regexp = "(\\w+)://([^/:]+)(:\\d*)?([^#\\s]*)";  
  
91.   /** 
  92.    * 匹配并提取http 
  93.    *  
  94.    * 格式: <A href="
http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX" target=_blank> http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX</A> 或 <A href="ftp: //XXX.XXX.XXX" target=_blank>ftp://XXX.XXX.XXX</A> 或 https: //XXX 
  95.    *  
  96.    * 匹配 : <A href="
http://www.suncer.com:8080/index.html?login=true" target=_blank>http://www.suncer.com:8080/index.html?login=true</A> 
  97.    *  
  98.    * 提取(MatchResult matchResult=matcher.getMatch()): matchResult.group(0)= 
  99.    * <A href="
http://www.suncer.com:8080/index.html?login=true" target=_blank>http://www.suncer.com:8080/index.html?login=true</A> matchResult.group(1) = 
 100.    * http matchResult.group(2) = <A href="www.suncer.com" target=_blank>www.suncer.com</A> matchResult.group(3) = :8080 
 101.    * matchResult.group(4) = /index.html?login=true 
 102.    *  
 103.    * 不匹配: news://www 
 104.    *  
 105.    
*/  
 
106.   public static final String http_regexp = "(http|https|ftp)://([^/:]+)(:\\d*)?([^#\\s]*)";  
 
107.   /** 
 108.    * 匹配日期 
 109.    *  
 110.    * 格式(首位不为0): XXXX-XX-XX 或 XXXX XX XX 或 XXXX-X-X 
 111.    *  
 112.    * 范围:1900--2099 
 113.    *  
 114.    * 匹配 : 2005-04-04 
 115.    *  
 116.    * 不匹配: 01-01-01 
 117.    *  
 118.    
*/  
 
119.   public static final String date_regexp = "^((((19){1}|(20){1})d{2})|d{2})[-\\s]{1}[01]{1}d{1}[-\\s]{1}[0-3]{1}d{1}$";// 匹配日期  
 120.   /** 
 121.    * 匹配电话 
 122.    *  
 123.    * 格式为: 0XXX-XXXXXX(10-13位首位必须为0) 或0XXX XXXXXXX(10-13位首位必须为0) 或 
 124.    * (0XXX)XXXXXXXX(11-14位首位必须为0) 或 XXXXXXXX(6-8位首位不为0) 或 XXXXXXXXXXX(11位首位不为0) 
 125.    *  
 126.    * 匹配 : 0371-123456 或 (0371)1234567 或 (0371)12345678 或 010-123456 或 
 127.    * 010-12345678 或 12345678912 
 128.    *  
 129.    * 不匹配: 1111-134355 或 0123456789 
 130.    *  
 131.    
*/  
 
132.   public static final String phone_regexp = "^(?:0[0-9]{2,3}[-\\s]{1}|\\(0[0-9]{2,4}\\))[0-9]{6,8}$|^[1-9]{1}[0-9]{5,7}$|^[1-9]{1}[0-9]{10}$";  
 
133.   /** 
 134.    * 匹配身份证 
 135.    *  
 136.    * 格式为: XXXXXXXXXX(10位) 或 XXXXXXXXXXXXX(13位) 或 XXXXXXXXXXXXXXX(15位) 或 
 137.    * XXXXXXXXXXXXXXXXXX(18位) 
 138.    *  
 139.    * 匹配 : 0123456789123 
 140.    *  
 141.    * 不匹配: 0123456 
 142.    *  
 143.    
*/  
 
144.   public static final String ID_card_regexp = "^\\d{10}|\\d{13}|\\d{15}|\\d{18}$";  
 
145.   /** 
 146.    * 匹配邮编代码 
 147.    *  
 148.    * 格式为: XXXXXX(6位) 
 149.    *  
 150.    * 匹配 : 012345 
 151.    *  
 152.    * 不匹配: 0123456 
 153.    *  
 154.    
*/  
 
155.   public static final String ZIP_regexp = "^[0-9]{6}$";// 匹配邮编代码  
 156.   /** 
 157.    * 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 
 158.    * 即空格,制表符,回车符等 ) 
 159.    *  
 160.    * 格式为: x 或 一个一上的字符 
 161.    *  
 162.    * 匹配 : 012345 
 163.    *  
 164.    * 不匹配: 0123456 
 165.    *  
 166.    
*/  
 
167.   public static final String non_special_char_regexp = "^[^'\"\\;,:-<>\\s].+$";// 匹配邮编代码  
 168.   /** 
 169.    * 匹配非负整数(正整数 + 0) 
 170.    
*/  
 
171.   public static final String non_negative_integers_regexp = "^\\d+$";  
 
172.   /** 
 173.    * 匹配不包括零的非负整数(正整数 > 0) 
 174.    
*/  
 
175.   public static final String non_zero_negative_integers_regexp = "^[1-9]+\\d*$";  
 
176.   /** 
 177.    *  
 178.    * 匹配正整数 
 179.    *  
 180.    
*/  
 
181.   public static final String positive_integer_regexp = "^[0-9]*[1-9][0-9]*$";  
 
182.   /** 
 183.    *  
 184.    * 匹配非正整数(负整数 + 0) 
 185.    *  
 186.    
*/  
 
187.   public static final String non_positive_integers_regexp = "^((-\\d+)|(0+))$";  
 
188.   /** 
 189.    *  
 190.    * 匹配负整数 
 191.    *  
 192.    
*/  
 
193.   public static final String negative_integers_regexp = "^-[0-9]*[1-9][0-9]*$";  
 
194.   /** 
 195.    *  
 196.    * 匹配整数 
 197.    *  
 198.    
*/  
 
199.   public static final String integer_regexp = "^-?\\d+$";  
 
200.   /** 
 201.    *  
 202.    * 匹配非负浮点数(正浮点数 + 0) 
 203.    *  
 204.    
*/  
 
205.   public static final String non_negative_rational_numbers_regexp = "^\\d+(\\.\\d+)?$";  
 
206.   /** 
 207.    *  
 208.    * 匹配正浮点数 
 209.    *  
 210.    
*/  
 
211.   public static final String positive_rational_numbers_regexp = "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$";  
 
212.   /** 
 213.    *  
 214.    * 匹配非正浮点数(负浮点数 + 0) 
 215.    *  
 216.    
*/  
 
217.   public static final String non_positive_rational_numbers_regexp = "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$";  
 
218.   /** 
 219.    *  
 220.    * 匹配负浮点数 
 221.    *  
 222.    
*/  
 
223.   public static final String negative_rational_numbers_regexp = "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$";  
 
224.   /** 
 225.    *  
 226.    * 匹配浮点数 
 227.    *  
 228.    
*/  
 
229.   public static final String rational_numbers_regexp = "^(-?\\d+)(\\.\\d+)?$";  
 
230.   /** 
 231.    *  
 232.    * 匹配由26个英文字母组成的字符串 
 233.    *  
 234.    
*/  
 
235.   public static final String letter_regexp = "^[A-Za-z]+$";  
 
236.   /** 
 237.    *  
 238.    * 匹配由26个英文字母的大写组成的字符串 
 239.    *  
 240.    
*/  
 
241.   public static final String upward_letter_regexp = "^[A-Z]+$";  
 
242.   /** 
 243.    *  
 244.    * 匹配由26个英文字母的小写组成的字符串 
 245.    *  
 246.    
*/  
 
247.   public static final String lower_letter_regexp = "^[a-z]+$";  
 
248.   /** 
 249.    *  
 250.    * 匹配由数字和26个英文字母组成的字符串 
 251.    *  
 252.    
*/  
 
253.   public static final String letter_number_regexp = "^[A-Za-z0-9]+$";  
 
254.   /** 
 255.    *  
 256.    * 匹配由数字、26个英文字母或者下划线组成的字符串 
 257.    *  
 258.    
*/  
 
259.   public static final String letter_number_underline_regexp = "^\\w+$";  
 
260.   
 
261.   /** 
 262.    * 添加正规表达式 (以key->value的形式存储) 
 263.    *  
 264.    * 
@param regexpName 
 265.    *          该正规表达式名称 ` 
 266.    * 
@param regexp 
 267.    *          该正规表达式内容 
 268.    
*/  
 
269.   public void putRegexpHash(String regexpName, String regexp) {  
 
270.     regexpHash.put(regexpName, regexp);  
 
271.   }  
 
272.   
 
273.   /** 
 274.    * 得到正规表达式内容 (通过key名提取出value[正规表达式内容]) 
 275.    *  
 276.    * 
@param regexpName 
 277.    *          正规表达式名称 
 278.    *  
 279.    * 
@return 正规表达式内容 
 280.    
*/  
 
281.   public String getRegexpHash(String regexpName) {  
 
282.     if (regexpHash.get(regexpName) != null) {  
 
283.       return ((String) regexpHash.get(regexpName));  
 
284.     } else {  
 
285.       System.out.println("在regexpHash中没有此正规表达式");  
 
286.       return "";  
 
287.     }  
 
288.   }  
 
289.   
 
290.   /** 
 291.    * 清除正规表达式存放单元 
 292.    
*/  
 
293.   public void clearRegexpHash() {  
 
294.     regexpHash.clear();  
 
295.     return;  
 
296.   }  
 
297.   
 
298.   /** 
 299.    * 大小写敏感的正规表达式批配 
 300.    *  
 301.    * 
@param source 
 302.    *          批配的源字符串 
 303.    *  
 304.    * 
@param regexp 
 305.    *          批配的正规表达式 
 306.    *  
 307.    * 
@return 如果源字符串符合要求返回真,否则返回假 如: 
 308.    *         Regexp.isHardRegexpValidate("ygj@suncer.com.cn",email_regexp) 返回真 
 309.    
*/  
 
310.   public static boolean isHardRegexpValidate(String source, String regexp) {  
 
311.     try {  
 
312.       // 用于定义正规表达式对象模板类型  
 313.       PatternCompiler compiler = new Perl5Compiler();  
 
314.       // 正规表达式比较批配对象  
 315.       PatternMatcher matcher = new Perl5Matcher();  
 
316.       // 实例大小大小写敏感的正规表达式模板  
 317.       Pattern hardPattern = compiler.compile(regexp);  
 
318.       // 返回批配结果  
 319.       return matcher.contains(source, hardPattern);  
 
320.     } catch (MalformedPatternException e) {  
 
321.       e.printStackTrace();  
 
322.     }  
 
323.     return false;  
 
324.   }  
 
325. } 

posted on 2009-08-08 09:01 石头@ 阅读(1248) 评论(0)  编辑  收藏 所属分类: 基础技术


只有注册用户登录后才能发表评论。


网站导航: