返回列表 发帖

javascript极速狂飙:大容量字符型数组的快速检索

javascript 在大容量数组的循环方面效率不尽人意,我曾经做过一个比对,与vbs的数组相比较,vbs的数组循环速度大致比js要快一个数量级(http://community.csdn.net/expert/topicview.asp?id=4313487)。js数组在一般的编程当中我们也不会太去注意它的效率问题:才几十个元素的数组效率即使差点你也看不出来,但节点量一大,比如几千、比如上万个节点量的数组循环,那效率问题就成了首要考虑解决的问题了。大容量数组的检索大致有以下几个应用:select做combo box时的快速匹配、树的查询、表格table排序或者检索等。

下面我来做一个测试,首先我先创建一个大容量的数组:

<script language="javascript">
var n = 100000; //数组的最大容量
var a = new array();
for(var i=0; i<n; i++)
{
a = math.random() +"";
}
</script>

这样我就创建了一个长度为 100000 的字符型数组,然后我再检索字符串以 0.9999 开始的字符串,并存入另一个数组中。

<script language="javascript">
var n = 100000; //数组的最大容量
var a = new array();
for(var i=0; i<n; i++)
{
a = math.random() +"";
}

var begin = new date().gettime();
var b = new array();
for(var i=0; i<n; i++)
{
if(a.indexof("0.9999")==0)
{
b[b.length] = a;
}
}
document.write("数组长度:"+ n);
document.write("<br>传统循环法耗时 "+ (new date().gettime() - begin)
+" 毫秒!检索的结果:<strong title='"+ b.join("&#13;")
+"'>检索到 "+ b.length +" 个记录!</strong>");
</script>

这步操作我这里耗时都在2800毫秒左右,说明一下,这里的循环非常简单,只有一个 if 判断和一个赋值操作,非常简单,若这里的判断稍微复杂一些那它的耗时将是数量级的增大。那么对于这种问题有什么好的优化方案吗?答案当然是有的,否则我开这个贴子说的全是费话了。但是对于这个问题不能再使用我们的传统思维来优化,因为在传统的思维里已经找不出再好的写法了。

解决的方案就是:先把数组join()成一个大字符串,然后用正则表达式对这个大字符串进行匹配检索。这个方法算是我的个人独创吧,在我写树的过程中想出的歪招,不过效率真的不赖。关于join()的效率我已经开贴讨论过了(http://blog.csdn.net/meizz/archive /2005/12/14/552260.aspx javascript极速狂飙:组合拼接字符串的效率)。这个优化方案需要有一定的正则表达式功底。

<input id="count" value="50000" size="7" maxlength="6">
<input type="button" value="数组初始华" onclick="txt.innerhtml = array_init()"><br>
<input type="button" value="传统循环" onclick="txt.innerhtml += method_for()">
<input type="button" value="正则匹配" onclick="txt.innerhtml += method_regexp()">
<div id="txt"></div>

<script language="javascript">
var txt = document.getelementbyid("txt");
var a = new array();

function array_init()
{
var n = parseint(document.getelementbyid("count").value);
a.length = 0;
for(var i=0; i<n; i++)
{
a = math.random() +"";
}
return "数组长度:"+ n;
}

function method_for()
{
var n = a.length;
var begin = new date().gettime();
var b = new array();
for(var i=0; i<n; i++)
{
if(a.indexof("0.9999")==0)
{
b[b.length] = a;
}
}
return ("<br>传统循环法耗时 "+ (new date().gettime() - begin)
+" 毫秒!检索的结果:<strong title='"+ b.join("&#13;")
+"'>检索到 "+ b.length +" 个记录!</strong>");
}

function method_regexp()
{
var begin = new date().gettime();
var b = new array();
var s = a.join("\x0f");
var r = new regexp().compile("0\\.9999\\d+", "g");
b = s.match(r); s = "";
return ("<br>正则匹配法耗时 "+ (new date().gettime() - begin)
+" 毫秒!检索的结果:<strong title='"+ b.join("&#13;")
+"'>检索到 "+ b.length +" 个记录!</strong>");
}
</script>

大家可以测试一下,上面两种方法之间的效率到底相差多少!代码是死的,人是活的,换一种思维换一种模式,效率将大相径庭。

这一招我是花了好多脑筋才想出来的招,真有点舍不得放出来,现在就拿它恭贺大家2006新的一年的开始吧。
让中国Python发展的更快 ,更好.

返回列表