home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 10 Tools / 10-Tools.zip / perl_mlb.zip / AutoSplit.pm < prev    next >
Text File  |  1997-11-25  |  12KB  |  366 lines

  1. package AutoSplit;
  2.  
  3. require 5.000;
  4. require Exporter;
  5.  
  6. use Config;
  7. use Carp;
  8. use File::Path qw(mkpath);
  9.  
  10. @ISA = qw(Exporter);
  11. @EXPORT = qw(&autosplit &autosplit_lib_modules);
  12. @EXPORT_OK = qw($Verbose $Keep $Maxlen $CheckForAutoloader $CheckModTime);
  13.  
  14. =head1 NAME
  15.  
  16. AutoSplit - split a package for autoloading
  17.  
  18. =head1 SYNOPSIS
  19.  
  20.  perl -e 'use AutoSplit; autosplit_lib_modules(@ARGV)' ...
  21.  
  22.  use AutoSplit; autosplit($file, $dir, $keep, $check, $modtime);
  23.  
  24. for perl versions 5.002 and later:
  25.  
  26.  perl -MAutoSplit -e 'autosplit($ARGV[0], $ARGV[1], $k, $chk, $modtime)' ...
  27.  
  28. =head1 DESCRIPTION
  29.  
  30. This function will split up your program into files that the AutoLoader
  31. module can handle. It is used by both the standard perl libraries and by
  32. the MakeMaker utility, to automatically configure libraries for autoloading.
  33.  
  34. The C<autosplit> interface splits the specified file into a hierarchy 
  35. rooted at the directory C<$dir>. It creates directories as needed to reflect
  36. class hierarchy, and creates the file F<autosplit.ix>. This file acts as
  37. both forward declaration of all package routines, and as timestamp for the
  38. last update of the hierarchy.
  39.  
  40. The remaining three arguments to C<autosplit> govern other options to the
  41. autosplitter. If the third argument, I<$keep>, is false, then any pre-existing
  42. C<*.al> files in the autoload directory are removed if they are no longer
  43. part of the module (obsoleted functions). The fourth argument, I<$check>,
  44. instructs C<autosplit> to check the module currently being split to ensure
  45. that it does include a C<use> specification for the AutoLoader module, and
  46. skips the module if AutoLoader is not detected. Lastly, the I<$modtime>
  47. argument specifies that C<autosplit> is to check the modification time of the
  48. module against that of the C<autosplit.ix> file, and only split the module
  49. if it is newer.
  50.  
  51. Typical use of AutoSplit in the perl MakeMaker utility is via the command-line
  52. with:
  53.  
  54.  perl -e 'use AutoSplit; autosplit($ARGV[0], $ARGV[1], 0, 1, 1)'
  55.  
  56. Defined as a Make macro, it is invoked with file and directory arguments;
  57. C<autosplit> will split the specified file into the specified directory and
  58. delete obsolete C<.al> files, after checking first that the module does use
  59. the AutoLoader, and ensuring that the module is not already currently split
  60. in its current form (the modtime test).
  61.  
  62. The C<autosplit_lib_modules> form is used in the building of perl. It takes
  63. as input a list of files (modules) that are assumed to reside in a directory
  64. B<lib> relative to the current directory. Each file is sent to the 
  65. autosplitter one at a time, to be split into the directory B<lib/auto>.
  66.  
  67. In both usages of the autosplitter, only subroutines defined following the
  68. perl special marker I<__END__> are split out into separate files. Some
  69. routines may be placed prior to this marker to force their immediate loading
  70. and parsing.
  71.  
  72. =head1 CAVEATS
  73.  
  74. Currently, C<AutoSplit> cannot handle multiple package specifications
  75. within one file.
  76.  
  77. =head1 DIAGNOSTICS
  78.  
  79. C<AutoSplit> will inform the user if it is necessary to create the top-level
  80. directory specified in the invocation. It is preferred that the script or
  81. installation process that invokes C<AutoSplit> have created the full directory
  82. path ahead of time. This warning may indicate that the module is being split
  83. into an incorrect path.
  84.  
  85. C<AutoSplit> will warn the user of all subroutines whose name causes potential
  86. file naming conflicts on machines with drastically limited (8 characters or
  87. less) file name length. Since the subroutine name is used as the file name,
  88. these warnings can aid in portability to such systems.
  89.  
  90. Warnings are issued and the file skipped if C<AutoSplit> cannot locate either
  91. the I<__END__> marker or a "package Name;"-style specification.
  92.  
  93. C<AutoSplit> will also emit general diagnostics for inability to create
  94. directories or files.
  95.  
  96. =cut
  97.  
  98. # for portability warn about names longer than $maxlen
  99. $Maxlen  = 8;    # 8 for dos, 11 (14-".al") for SYSVR3
  100. $Verbose = 1;    # 0=none, 1=minimal, 2=list .al files
  101. $Keep    = 0;
  102. $CheckForAutoloader = 1;
  103. $CheckModTime = 1;
  104.  
  105. $IndexFile = "autosplit.ix";    # file also serves as timestamp
  106. $maxflen = 255;
  107. $maxflen = 14 if $Config{'d_flexfnam'} ne 'define';
  108. $Is_VMS = ($^O eq 'VMS');
  109.  
  110.  
  111. sub autosplit{
  112.     my($file, $autodir,  $k, $ckal, $ckmt) = @_;
  113.     # $file    - the perl source file to be split (after __END__)
  114.     # $autodir - the ".../auto" dir below which to write split subs
  115.     # Handle optional flags:
  116.     $keep = $Keep unless defined $k;
  117.     $ckal = $CheckForAutoloader unless defined $ckal;
  118.     $ckmt = $CheckModTime unless defined $ckmt;
  119.     autosplit_file($file, $autodir, $keep, $ckal, $ckmt);
  120. }
  121.  
  122.  
  123. # This function is used during perl building/installation
  124. # ./miniperl -e 'use AutoSplit; autosplit_lib_modules(@ARGV)' ...
  125.  
  126. sub autosplit_lib_modules{
  127.     my(@modules) = @_; # list of Module names
  128.  
  129.     while(defined($_ = shift @modules)){
  130.     s#::#/#g;    # incase specified as ABC::XYZ
  131.     s|\\|/|g;        # bug in ksh OS/2
  132.     s#^lib/##; # incase specified as lib/*.pm
  133.     if ($Is_VMS && /[:>\]]/) { # may need to convert VMS-style filespecs
  134.         my ($dir,$name) = (/(.*])(.*)/);
  135.         $dir =~ s/.*lib[\.\]]//;
  136.         $dir =~ s#[\.\]]#/#g;
  137.         $_ = $dir . $name;
  138.     }
  139.     autosplit_file("lib/$_", "lib/auto", $Keep, $CheckForAutoloader, $CheckModTime);
  140.     }
  141.     0;
  142. }
  143.  
  144.  
  145. # private functions
  146.  
  147. sub autosplit_file{
  148.     my($filename, $autodir, $keep, $check_for_autoloader, $check_mod_time) = @_;
  149.     my(@names);
  150.     local($_);
  151.  
  152.     # where to write output files
  153.     $autodir = "lib/auto" unless $autodir;
  154.     if ($Is_VMS) {
  155.     ($autodir = VMS::Filespec::unixpath($autodir)) =~ s{/$}{};
  156.     $filename = VMS::Filespec::unixify($filename); # may have dirs
  157.     }
  158.     unless (-d $autodir){
  159.     mkpath($autodir,0,0755);
  160.     # We should never need to create the auto dir here. installperl
  161.     # (or similar) should have done it. Expecting it to exist is a valuable
  162.     # sanity check against autosplitting into some random directory by mistake.
  163.     print "Warning: AutoSplit had to create top-level $autodir unexpectedly.\n";
  164.     }
  165.  
  166.     # allow just a package name to be used
  167.     $filename .= ".pm" unless ($filename =~ m/\.pm$/);
  168.  
  169.     open(IN, "<$filename") || die "AutoSplit: Can't open $filename: $!\n";
  170.     my($pm_mod_time) = (stat($filename))[9];
  171.     my($autoloader_seen) = 0;
  172.     my($in_pod) = 0;
  173.     while (<IN>) {
  174.     # Skip pod text.
  175.     $in_pod = 1 if /^=/;
  176.     $in_pod = 0 if /^=cut/;
  177.     next if ($in_pod || /^=cut/);
  178.  
  179.     # record last package name seen
  180.     $package = $1 if (m/^\s*package\s+([\w:]+)\s*;/);
  181.     ++$autoloader_seen if m/^\s*(use|require)\s+AutoLoader\b/;
  182.     ++$autoloader_seen if m/\bISA\s*=.*\bAutoLoader\b/;
  183.     last if /^__END__/;
  184.     }
  185.     if ($check_for_autoloader && !$autoloader_seen){
  186.     print "AutoSplit skipped $filename: no AutoLoader used\n" if ($Verbose>=2);
  187.     return 0
  188.     }
  189.     $_ or die "Can't find __END__ in $filename\n";
  190.  
  191.     $package or die "Can't find 'package Name;' in $filename\n";
  192.  
  193.     my($modpname) = $package; 
  194.     if ($^O eq 'MSWin32') {
  195.     $modpname =~ s#::#\\#g; 
  196.     } else {
  197.     $modpname =~ s#::#/#g;
  198.     }
  199.  
  200.     die "Package $package ($modpname.pm) does not match filename $filename"
  201.         unless ($filename =~ m/\Q$modpname.pm\E$/ or
  202.             ($^O eq "msdos") or ($^O eq 'MSWin32') or
  203.                 $Is_VMS && $filename =~ m/$modpname.pm/i);
  204.  
  205.     my($al_idx_file) = "$autodir/$modpname/$IndexFile";
  206.  
  207.     if ($check_mod_time){
  208.     my($al_ts_time) = (stat("$al_idx_file"))[9] || 1;
  209.     if ($al_ts_time >= $pm_mod_time){
  210.         print "AutoSplit skipped ($al_idx_file newer that $filename)\n"
  211.         if ($Verbose >= 2);
  212.         return undef;    # one undef, not a list
  213.     }
  214.     }
  215.  
  216.     my($from) = ($Verbose>=2) ? "$filename => " : "";
  217.     print "AutoSplitting $package ($from$autodir/$modpname)\n"
  218.     if $Verbose;
  219.  
  220.     unless (-d "$autodir/$modpname"){
  221.     mkpath("$autodir/$modpname",0,0777);
  222.     }
  223.  
  224.     # We must try to deal with some SVR3 systems with a limit of 14
  225.     # characters for file names. Sadly we *cannot* simply truncate all
  226.     # file names to 14 characters on these systems because we *must*
  227.     # create filenames which exactly match the names used by AutoLoader.pm.
  228.     # This is a problem because some systems silently truncate the file
  229.     # names while others treat long file names as an error.
  230.  
  231.     # We do not yet deal with multiple packages within one file.
  232.     # Ideally both of these styles should work.
  233.     #
  234.     #   package NAME;
  235.     #   __END__
  236.     #   sub AAA { ... }
  237.     #   package NAME::option1;
  238.     #   sub BBB { ... }
  239.     #   package NAME::option2;
  240.     #   sub BBB { ... }
  241.     #
  242.     #   package NAME;
  243.     #   __END__
  244.     #   sub AAA { ... }
  245.     #   sub NAME::option1::BBB { ... }
  246.     #   sub NAME::option2::BBB { ... }
  247.     #
  248.     # For now both of these produce warnings.
  249.  
  250.     open(OUT,">/dev/null") || open(OUT,">nla0:"); # avoid 'not opened' warning
  251.     my(@subnames, %proto);
  252.     my @cache = ();
  253.     my $caching = 1;
  254.     while (<IN>) {
  255.     next if /^=\w/ .. /^=cut/;
  256.     if (/^package ([\w:]+)\s*;/) {
  257.         warn "package $1; in AutoSplit section ignored. Not currently supported.";
  258.     }
  259.     if (/^sub\s+([\w:]+)(\s*\(.*?\))?/) {
  260.         print OUT "1;\n";
  261.         my $subname = $1;
  262.         $proto{$1} = $2 || '';
  263.         if ($subname =~ m/::/){
  264.         warn "subs with package names not currently supported in AutoSplit section";
  265.         }
  266.         push(@subnames, $subname);
  267.         my($lname, $sname) = ($subname, substr($subname,0,$maxflen-3));
  268.         my($lpath) = "$autodir/$modpname/$lname.al";
  269.         my($spath) = "$autodir/$modpname/$sname.al";
  270.         unless(open(OUT, ">$lpath")){
  271.         open(OUT, ">$spath") or die "Can't create $spath: $!\n";
  272.         push(@names, $sname);
  273.         print "  writing $spath (with truncated name)\n"
  274.             if ($Verbose>=1);
  275.         }else{
  276.         push(@names, $lname);
  277.         print "  writing $lpath\n" if ($Verbose>=2);
  278.         }
  279.         print OUT "# NOTE: Derived from $filename.  ",
  280.             "Changes made here will be lost.\n";
  281.         print OUT "package $package;\n\n";
  282.         print OUT @cache;
  283.         @cache = ();
  284.         $caching = 0;
  285.     }
  286.     if($caching) {
  287.         push(@cache, $_) if @cache || /\S/;
  288.     }
  289.     else {
  290.         print OUT $_;
  291.     }
  292.     if(/^}/) {
  293.         if($caching) {
  294.         print OUT @cache;
  295.         @cache = ();
  296.         }
  297.         print OUT "\n";
  298.         $caching = 1;
  299.     }
  300.     }
  301.     print OUT @cache,"1;\n";
  302.     close(OUT);
  303.     close(IN);
  304.  
  305.     if (!$keep){  # don't keep any obsolete *.al files in the directory
  306.     my(%names);
  307.     @names{@names} = @names;
  308.     opendir(OUTDIR,"$autodir/$modpname");
  309.     foreach(sort readdir(OUTDIR)){
  310.         next unless /\.al$/;
  311.         my($subname) = m/(.*)\.al$/;
  312.         next if $names{substr($subname,0,$maxflen-3)};
  313.         my($file) = "$autodir/$modpname/$_";
  314.         print "  deleting $file\n" if ($Verbose>=2);
  315.         my($deleted,$thistime);  # catch all versions on VMS
  316.         do { $deleted += ($thistime = unlink $file) } while ($thistime);
  317.         carp "Unable to delete $file: $!" unless $deleted;
  318.     }
  319.     closedir(OUTDIR);
  320.     }
  321.  
  322.     open(TS,">$al_idx_file") or
  323.     carp "AutoSplit: unable to create timestamp file ($al_idx_file): $!";
  324.     print TS "# Index created by AutoSplit for $filename (file acts as timestamp)\n";
  325.     print TS "package $package;\n";
  326.     print TS map("sub $_$proto{$_} ;\n", @subnames);
  327.     print TS "1;\n";
  328.     close(TS);
  329.  
  330.     check_unique($package, $Maxlen, 1, @names);
  331.  
  332.     @names;
  333. }
  334.  
  335.  
  336. sub check_unique{
  337.     my($module, $maxlen, $warn, @names) = @_;
  338.     my(%notuniq) = ();
  339.     my(%shorts)  = ();
  340.     my(@toolong) = grep(length > $maxlen, @names);
  341.  
  342.     foreach(@toolong){
  343.     my($trunc) = substr($_,0,$maxlen);
  344.     $notuniq{$trunc}=1 if $shorts{$trunc};
  345.     $shorts{$trunc} = ($shorts{$trunc}) ? "$shorts{$trunc}, $_" : $_;
  346.     }
  347.     if (%notuniq && $warn){
  348.     print "$module: some names are not unique when truncated to $maxlen characters:\n";
  349.     foreach(keys %notuniq){
  350.         print " $shorts{$_} truncate to $_\n";
  351.     }
  352.     }
  353.     %notuniq;
  354. }
  355.  
  356. 1;
  357. __END__
  358.  
  359. # test functions so AutoSplit.pm can be applied to itself:
  360. sub test1{ "test 1\n"; }
  361. sub test2{ "test 2\n"; }
  362. sub test3{ "test 3\n"; }
  363. sub test4{ "test 4\n"; }
  364.  
  365.  
  366.