从细节处提升Perl性能

从细节处提升Perl性能

日期:2005-12-11 19:58:24  点击:222  作者:  来源:

Description

下面所写的各点都是我从其他地方找过来了。整理一下希望对各位有所帮助。

Details

变量和常量

1, 尽量减少数学表达式的计算,如
$day = 24*60*60; # 不好
$day = 86400; # better
 数据挖掘实验室 
2, 使用vec函数而不是变量来存放非常小的数字。

print

1, 如果输出里没有变量需要内插,使用单引号"而不是双引号".因为双引号会强制 Perl 检查可能插入的信息
2, 多段输出时用,而不是.。因为连接操作符.会首先将字符串连接在一起,然后将其作为一个参数打印

避免没必要的引号

摘自 FAQ 3.16: How can I make my Perl program take less memory?
没有绝对必要不要使用引号:
my $copy = "$large_string"; 

数据挖掘论坛

上述会$large_string做两次拷贝(一是拷贝到 $copy 另一次是引号内插),反之
my $copy = $large_string; 数据挖掘实验室 
只做一次拷贝。

数组字符串化

同样摘自 FAQ 3.16
对于大数组字符串化:
{
    local $, = "
";
    print @big_array;
} 数据挖掘工具 
比下面两样都更节省内存
print join "
", @big_array;

#or

{
    local $" = "
";
    print "@big_array";
} 数据挖掘交友 

引用

如果使用大型数组或 hash 表,并使用它们作为函数的参数,那么应该使用它们的一个引用,而不应该直接使用它们。通过使用引用,可以告诉函数指向信息的指针。如果不使用引用,就需要将整个数组或 hash 表复制到该函数的调用栈中,然后在函数中再次对其进行复制。引用还可以节省内存(这可以减少足迹和管理的负载),并简化您的编程。

循环

尽早在循环内放置条件语句,以使Perl不执行无用的语句。如
while () {
    chomp;
    next if /^#/;
 

数据挖掘实验室

next可以放在chomp上面。

有选择性地使用 map 和 grep

摘自 FAQ 3.16: How can I make my Perl program take less memory?
因为 map 和 grep 是使用 LIST 列表参数,所以这么做
@wanted = grep {/pattern/} ;  
会一次性读入整个文件。对于大文件来说,使用循环会更好一点:
while () {
    push(@wanted, $_) if /pattern/;
} 数据挖掘交友 

正则表达式

  1. pack/unpack > regexp > substr
  2. 删除字符串中的字符时用tr///d来代替s///g
  3. 在正则表达式的外面使用“or”或“||”操作。
    $found = if /one/ || /two/; # better
    $found = if /one|two/; # use above to replace
     数据挖掘论坛 
  4. 如果字符串很长,正则表达式很复杂,可以使用study来加快速度

数据结构

Tie::SubstrHash 对于某些类型的数据结构会有所帮助

=pod

如果您用了一大块 pod 来描述你的代码,那么请尽量不要将其放在文件的上面或中间部分。虽然 perl 分析器能很快的跳过 pod ,但是这不是魔法,它还是需要一点时间的。它还是需要从磁盘中读入它,并且读入的目的仅仅是忽略它。将所有的pod放到__END__后面,那样 Perl 编译器就不会去注意它。
但是将pod与相关代码放在一起或许是种好习惯。

warnings/strict

强烈建议编程和调试时开启,而在代码发布时去掉它们。

Final

最后强烈建议各位阅读参考里的“When perl is not quite fast enough”。

参考/Refer

[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:PHP 对比 PERL
下一篇:从细节处提升Perl性能
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • Perl 常用函数
  • Perl直接入门详尽指南
  • 用Perl生成随机密码
  • When perl is not quite fast enough
  • Perl简单模块指南
  • Perl DBI连接MySQL数据库
  • 我对 Catalyst 的理解和介绍
  • cgi学习简明教程
  • 我对 Catalyst 的理解和介绍
  • 如何使用strict和warnings
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
    数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静