极速统计数组重复并分类源码

先讲下算法吧

主要里利用“节点”的特性优化速度,此法速度也许算不上最快的,但算法肯定是最简单的

节点特性1:节点类似与哈希表,当向节点内加入一个新属性时,返回成功,当向节点内加入一个已存在的同名属性时则返回失败,利用这个特性可以很容易判断数组成员是不是重复

节点特性2:虽然无法加入同名的属性,但却可以修同名属性的属性值,利用这点可以记录每个数组成员的重复次数

由此可见,只需要一次计次循环就能完成数组去重+分类统计重复次数,相对于嵌套多层循环比对的方法效率要高得多

根据反复测试的结果,发现一个重要的规律

当数组成员数一样时,统计耗时跟去重后的成员数成反比,也就是说同样为10万数组,去重后为1000个成员的耗时比去重后为100个成员耗时多8~10倍左右

为什么会有这种规律?应该是节点的另一个特性:加入新属性耗时修改已有的属性值要慢得多

以上为本人的一点愚见,欢迎有大神可以分享效率更高的算法。

9.12日重要更新

根据@猥琐小胖子和@ANJIANTEST大神的提示,增加了哈希表法,对于完全不重复的数组统计的效率要比节点法高几百倍(1秒内可以完成10万数组统计分类)。

极速统计数组重复并分类.png

相关文件下载地址
©下载资源版权归作者所有;本站所有资源均来源于网络,仅供学习使用,请支持正版!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注