IP地址的正则表达式 分析详解

IP地址的长度为32位,分为4段,每段8位,用十进制数字表示,每段数字范围为0~255,段与段之间用英文句点“.”隔开。例如:某台计算机IP地址为10.11.44.100。

分析IP地址的组成特点:250-255、200-249、0-199。 
这三种情况可以分开考虑, 

250-255:特点:三位数,百位是2,十位是5,个位是0~5,用正则表达式可以写成:25[0-5] 
200-249:特点:三位数,百位是2,十位是0~4,个位是0~9,用正则表达式可以写成:2[0-4]d 
0-199:这个可以继续分拆,这样写起来更加简单明了. 


0-9:    特点:一位数,个位是0~9,用正则表达式可以写成:d 
10-99:  特点:二位数,十位是1~9,个位是0~9,用正则表达式可以写成:[1-9]d 
100-199:特点:三位数,百位是1,十位是0~9,个位是0~9,用正则表达式可以写成:1d{2}

于是0-99的正则表达式可以合写为[1-9]?d,那么0-199用正则表达式就可以写成(1d{2})|([1-9]?d),这样0~255的正则表达式就可以写成(25[0-5]|2[0-4]d|((1d{2})|([1-9]?d))) 
最后,前面3段加上句点.可以使用{3}重复得到,第4段再来一次同样的匹配,得到IP地址的正则表达式:

((?:(?:25[0-5]|2[0-4]d|((1d{2})|([1-9]?d))).){3}(?:25[0-5]|2[0-4]d|((1d{2})|([1-9]?d))))

与大家互动一下: 

  1.   为什么三位数的匹配放在二位数/一位数的前面?因为正则表达式规则之一:最先开始的匹配拥有最高的优先权。 
    2.  0.0.0.0和255.255.255.255是合法存在的IP地址,你知道是为什么吗?
    3.  192.169.01.108这种数字前面多带了个0的类型的,在这里不是合法的,为什么要这样?
    4.  为什么前面在最前面要有?:呢?它在这里有什么用? 
    5.  如果您发现本表达式有错误,也请留言指正!

我使用的正则表达式验证工具,The Regulator 下载地址:http://sourceforge.net/projects/regulator/

温馨提示: 本文最后更新于2024-12-31 21:05:40,某些文章具有时效性,若有错误或已失效,请在下方 留言或联系 蚂蚁官方
© 版权声明
THE END
喜欢就支持一下吧
点赞13赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容