Posts Tagged ‘正则表达式’

2011年06月17日

去某公司(公司名不说了,人这套题说不定还要用)面试,现场30分钟做了一套题,其中有一道是这样的:

要求用js写一个函数,对传入的形如下网址字符串,返回对应的对象。
如:
若传入字符串a=’?name=zhiyelee&blog=www.tsnrose.com’;
则返回 b={‘name’:’zhiyelee’,’blog’:’www.tsnrose.com’}

当时由于时间比较短,实现的有些问题,回来后想了一下,总结如下:
我想到了两种思路,一种是使用正则表达式,第二种是使用字符串的split函数。
1、使用正则表达式处理
我首先想到的是使用正则表达式处理,可能是感觉这个更有挑战性写起来也最简洁,不过当时怀疑这种方法的效率会低于直接使用字符串函数处理的效率。这个效率我们在下文会验证~
这个方法的思路很简单,就是使用正则表达式每次匹配出一个‘***=###’串,然后循环最后取出所有。
代码如下

var getNRReg = function(str) {
var res = {};
var reg = /(\w+)=(\w+)/g;
while ((a = reg.exec(str))) {
res[a[1]] = a[2];
}
return res;
};

2、使用字符串函数处理
这种想法思路也比较常规,不过写起来肯定要比使用正则表达式处理麻烦一些。
我的思路首先用‘&’将原串分割成多个字串,每个字串的样式如‘***=###’,然后再对字串应用split(‘=’)。(此种方法没有使用正则,当然我们可以使用正则split(/&|=/)
代码如下

var getNRSplit = function(str) {
var [...]

Tags: ,,. 901 人浏览
2011年03月19日

最近在学jQuery,于是买了本《锋利的jQuery》想系统的学一下,省得网上学的只鳞片爪的没有一个系统的结构。不过买了后才发现这本书果然如网上评价的一般:错误很多。买书,还是买国外的经典版比较好,省得看的时候被硌着眼。

前不久把 CSS Mastery啃完了,心痒难耐想逐步美化下自己的页面,顺便练练手。从图片做起,给图片加了个边框,做了圆角然后弄了个阴影,完事后觉得效果还是不甚明显,于是琢磨着给图片加个悬浮标题。结合正在学的jQuery搞了一个:Demo
1、功能
将图片img的相关属性提取出来显示为悬浮标题。提取的规则:

1、若图片有title属性,提取title属性并显示。
2、若无title属性,提取alt属性并显示。
3、若无title属性,也无alt属性,提取图片名并显示,如aa.jpg bb.png cc.gif dd.bmp ee.jpeg等。

ps:我这儿未考虑图片的src不是以后缀名结尾的形式。
2、实现
用的jQuery实现的,当然其中涉及到css,然后就是在获取图片名称时用到了正则表达式。
来看一下核心代码。注释看Demo里的源码

$(window).load(function() {
$("img").each(function() {

$("img:not([title])").each(function() {
var img_src=$(this).attr("src");
var img_name=img_src.match(/[^/]+.(jpg|png|jpeg|gif|bmp)/ig);
if($(this).attr("alt") !=”) $(this).attr("title", $(this).attr("alt"))
else $(this).attr("title", img_name);
});
var $img=$(this);
$(this).wrap("<span class=’hover_image’ style=’width:"+$img.width()+"px’></span>");
$(this).parent(".hover_image").hover(function(){
$(this).append("<div class=’hover_title ‘ style=’width:"+$img.width()*0.5+"px;left:"
+($img.offset().left-$img.parent().offset().left)+"px’>"
+$img.attr("title")+"</div>");
$img.next().show();},
function(){$img.next().fadeOut("slow").remove();});
});
});

Tags: ,,. 1,240 人浏览
2010年09月21日

正则表达式这东西真的很有意思,也很有用。
文章中这个检查素数的正则表达式包含了正则表达式后向引用,惰性与贪婪特性等的应用,很有创意的说。
仔细琢磨琢磨会很有收获。

一般来说,我们会使用正规表达式来做字符串匹配,今天在网上浏览的时候,看到了有人用正则表达式来检查一个数字是否为素数(质数),让我非常感兴趣,这个正则表达式如入所示:
/^1?$|^(11+?)\1+$/
要使用这个正规则表达式,你需要把自然数转成多个1的字符串,如:2 要写成 “11”, 3 要写成 “111”, 17 要写成“11111111111111111”,这种工作使用一些脚本语言可以轻松的完成。
一开始我对这个表达式持怀疑态度,但仔细研究了一下这个表达式,发现是非常合理的,下面,让我带你来细细剖析一下是这个表达式的工作原理。
首先,我们看到这个表达式中有“|”,也就是说这个表达式可以分成两个部分:/^1?$/ 和 /^(11+?)\1+$/
第一部分:/^1?$/, 这个部分相信不用我多说了,其表示匹配“空串”以及字串中只有一个“1”的字符串。
第二部分:/^(11+?)\1+$/,这个部分是整个表达式的关键部分。其可以分成两个部分,(11+?) 和\1+$,前半部很简单了,匹配以“11”开头的并重复0或n个1的字符串,后面的部分意思是把前半部分作为一个字串去匹配还剩下的字符串1次或多次(这句话的意思是——剩余的字串的1的个数要是前面字串1个数的整数倍)。
可见这个正规则表达式是取非素数,要得到素数还得要对整个表达式求反。通过上面的分析,我们知道,第二部分是最重要的,对于第二部分,举几个例子,
示例一:判断自然数8。我们可以知道,8转成我们的格式就是“11111111”,对于(11+?),其匹配了“11”,于是还剩下“111111”,而\1+$正好匹配了剩下的“111111”,因为,“11”这个模式在“111111”出现了三次,符合模式匹配,返回true。所以,匹配成功,于是这个数不是质数。
示例二:判断自然数11。转成我们需要的格式是“11111111111”(十一个1),对于(11+?),其匹配了“11”(前两个1),还剩下“111111111”(九个1),而\1+$无法为“11”匹配那“九个1”,因为“11”这个模式并没有在“九个1”这个串中正好出现N次。于是,我们的正则表达式引擎会尝试下一种方法,先匹配“111”(前三个1),然后把“111”作为模式去匹配剩下的“11111111”(八个1),很明显,那“八个1”并没有匹配“三个1”多次。所以,引擎会继续向下尝试……直至尝试所有可能都无法匹配成功。所以11是素数。
通过示例二,我们可以得到这样的等价数算算法,正则表达式会匹配这若干个1中有没有出现“二个1”的整数倍,“三个1”的整数倍,“四个1”的整数倍……,而,这正好是我们需要的算素数的算法。现在大家明白了吧。
下面,我们用perl来使用这个正规则表达式不停地输出素数:(关于perl的语法我就不多说了,请注意表达式前的取反操作符)
perl -e’$|++;(1 x$_)!~/^1?$|^(11+?)\1+$/&&print”$_ “while ++$_’
另外,让我们来举一反三,根据上述的这种方法,我们甚至可以用正则表达式来求证某方式是否有解,如:
二元方程:17x + 12y = 51 判断其是否有解的正则表达式是:^(.*)\1{16}(.*)\2{11}$
三元方程:11x + 2y + 5z = 115 判断其是否有解的正则表达式是:^(.*)\1{10}(.*)\2{1}(.*)\3{4}$
大家不妨自己做做练习,为什么上述的两个正则表达式可以判断方程是否有解。如果无法参透其中的奥妙的话,你可以读读这篇英文文章。
来源:酷壳

Tags: . 1,973 人浏览
2010年09月13日

最近在啃正则表达式,Google上各种找教程,发现这篇文章,这是@摩诘翻译的RegexBuddy教程,原作者为Jan Goyvaerts。
RegexBuddy是一个不错的正则表达式工具,学习正则表达式的同学可以下来用下~~
1. 什么是正则表达式
基本说来,正则表达式是一种用来描述一定数量文本的模式。Regex代表Regular Express。本文将用<<regex>>来表示一段具体的正则表达式。
一段文本就是最基本的模式,简单的匹配相同的文本。
2. 不同的正则表达式引擎
正则表达式引擎是一种可以处理正则表达式的软件。通常,引擎是更大的应用程序的一部分。在软件世界,不同的正则表达式并不互相兼容。本教程会集中讨论Perl 5 类型的引擎,因为这种引擎是应用最广泛的引擎。同时我们也会提到一些和其他引擎的区别。许多近代的引擎都很类似,但不完全一样。例如.NET正则库,JDK正则包。
3. 文字符号
最基本的正则表达式由单个文字符号组成。如<<a>>,它将匹配字符串中第一次出现的字符“a”。如对字符串“Jack is a boy”。“J”后的“a”将被匹配。而第二个“a”将不会被匹配。
正则表达式也可以匹配第二个“a”,这必须是你告诉正则表达式引擎从第一次匹配的地方开始搜索。在文本编辑器中,你可以使用“查找下一个”。在编程语言中,会有一个函数可以使你从前一次匹配的位置开始继续向后搜索。
类似的,<<cat>>会匹配“About cats and dogs”中的“cat”。这等于是告诉正则表达式引擎,找到一个<<c>>,紧跟一个<<a>>,再跟一个<<t>>。
要注意,正则表达式引擎缺省是大小写敏感的。除非你告诉引擎忽略大小写,否则<<cat>>不会匹配“Cat”。
(1)、特殊字符

对于文字字符,有11个字符被保留作特殊用途。他们是:
[ ] \ ^ $ . | ? * + ( )
这些特殊字符也被称作元字符。
如果你想在正则表达式中将这些字符用作文本字符,你需要用反斜杠“\”对其进行换码 (escape)。例如你想匹配“1+1=2”,正确的表达式为<<1\+1=2>>.
需要注意的是,<<1+1=2>>也是有效的正则表达式。但它不会匹配“1+1=2”,而会匹配“123+111=234”中的“111=2”。因为“+”在这里表示特殊含义(重复1次到多次)。
在编程语言中,要注意,一些特殊的字符会先被编译器处理,然后再传递给正则引擎。因此正则表达式<<1\+2=2>>在C++中要写成“1\\+1=2”。为了匹配“C:\temp”,你要用正则表达式<<C:\\temp>>。而在C++中,正则表达式则变成了“C:\\\\temp”。
(2)、不可显示字符

可以使用特殊字符序列来代表某些不可显示字符:
<<\t>>代表Tab(0×09)
<<\r>>代表回车符(0×0D)
<<\n>>代表换行符(0×0A)
要注意的是Windows中文本文件使用“\r\n”来结束一行而Unix使用“\n”。
4. 正则表达式引擎的内部工作机制

Tags: . 786 人浏览