ungetestet:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
#!/usr/local/bin/perl
use strict;
use warnings;
use LWP::UserAgent;
print "\nWEBWORD gestartet!\n\n";
print "\nBitte Adresse angeben: (http://beispiel.de) ";
chomp(my $input_address = <STDIN>);
print "\nName der Wordlist: ";
chomp(my $name = <STDIN>); # auch hier das entfernen des "\n" nicht vergessen!
$name .= ".txt";
my $agent = new LWP::UserAgent;
my $request = HTTP::Request->new('GET',$input_address);
$result = $agent->request($request);
my $words=$result->content();
$words =~s/[\r\n]+/ /gs; # Zeilenumbrüche entfernen
$words =~s/<.+?>/ /g; # sehr anfällig. Löscht unter Umständen zu viel / zu wenig
$words =~s/{.+?}/ /g; # wofür ist das? CSS??
$words =~tr/\W\S//d; # Sonderzeichen entfernen
my @word_list=split(/\s+/,$words); # Wörter aufteilen und in Array schreiben.
open(OUT,">",$name) or die "Konnte ($name) nicht oeffnen ($!)\n";
print OUT join("\n",@word_list);
close(OUT);
Das Script sollte so ziemlich das selbe machen wie deines nur mit weniger unnötigen Aktionen. Dein Problem liegt an den ständigen schreiben und lesen von Dateien ohne auf die System spezifischen Zeilenumbrüche zu achten. Weißt du nicht wie man Splittet / mit Arrays bearbeitet?