DBI - Speichern von Daten - Anfängerfrage (Datenbanken und Verzeichnisdienste)

[thread]15545[/thread]

DBI - Speichern von Daten - Anfängerfrage

Leser: 22

Articles: hide open all | hide show old branches

+10 replies

lin

2010-10-16 22:43

User since
2010-09-26
35 Artikel
BenutzerIn
[default_avatar]

Hi Leute, habe jetzt mal wieder Zeit nach meinen Scripten zu gucken.

Nachdem vor einer Woche ein Parser fehlerfrei zum laufen kam bin ich jetzt dabei die Parserergebnisse in eine Datenbank zu speichern:

Danke nochmals an Topeq und andere für die Hilfe - beim Überarbeiten des Parsers. I/O Operations: Pfade übertragen auf einen HTML-Parser

Big Thx @ all, die hier geholfen haben.

Code (perl): (dl )

#!/usr/bin/perl

use strict;            # alles muss definiert sein
use warnings;          # wenn etwas nicht so ganz richtig ist warnen
use diagnostics;       # wenn etwas nicht passt ist warnen
use File::Find::Rule;  # finde Dateien/Verzeichnisse anhand von Regeln
use HTML::TokeParser;  # parse HTML-Dateien zum leichten auslesen von Daten

# Array in der alle Schulen mit ihren Daten gespeichert werden sollen
my @schools;

# Das Verzeichnis im dem gesucht werden soll
my $search_dir='.'; # ist das aktuelle Arbeitsverzeichnis

# die Datei in die alles gespeichert werden soll
my $out_file='./output.xml';

# Suche nach bestimmten Dateinamen
my @files= File::Find::Rule->file()            # suche eine Datei
                ->name('einzelergebnis*.html') # die mit "einzelergebnis" (alles klein geschieben!) beginnt und mit ".html" endet
                ->in($search_dir);              # suche in dem Verzeichnis


#gehe alle gefundenen Dateien durch
for my $file (@files)
{
  # Ausgabe, damit man weiß waw passiert.
  print "Bearbeite nun datei: $file!\n";

  # Speichrort für die Schuldaten in dieser Datei
  my %school;

  # starte seine neue Parser-Instanz mit der Datei als Quelle
  my $p = HTML::TokeParser->new($file) or die "Can't open $file: ($!)";

  #solange ein Tag von Typ 'div' gefunden wird
  while (my $tag = $p->get_tag('div', '/html'))
  {
    # first move to the right div that contains the information
    last if $tag->[0] eq '/html';
    next unless exists $tag->[1]{'id'} and $tag->[1]{'id'} eq 'inhalt_large';

    $p->get_tag('h1');
    $school{'location'} = $p->get_text('/h1');

    while (my $tag = $p->get_tag('div'))
    {
      last if exists $tag->[1]{'id'} and $tag->[1]{'id'} eq 'fusszeile';

      # get the school name from the heading
      next unless exists $tag->[1]{'class'} and $tag->[1]{'class'} eq 'fm_linkeSpalte';
      $p->get_tag('h2');
      $school{'name'} = $p->get_text('/h2');

      # verify format for school type
      $tag = $p->get_tag('span');
      unless (exists $tag->[1]{'class'} and $tag->[1]{'class'} eq 'schulart_text')
      {
        warn "unexpected format: parsing stopped";
        last;
      }

      $school{'type'} = $p->get_text('/span');

      # verify format for address
      $tag = $p->get_tag('p');
      unless (exists $tag->[1]{'class'} and $tag->[1]{'class'} eq 'einzel_text')
      {
        warn "unexpected format: parsing stopped";
        last;
      }
      $school{'address'} = clean_address($p->get_text('/p'));

      # find the description
      $tag = $p->get_tag('p');
      $school{'description'} = $p->get_text('/p');
    }
  }

  # speichere eine refenz auf den Hash mit den Daten der aktuellen Schule im Array mit allen Schulen
  push(@schools,\%school);
}

# Ausgabe in eine Datei als einfaches "XML" formatiert:
open(my $fh, '>', $out_file) or die("Error open $out_file ($!)\n");
print $fh "<schools>\n";
for my $school (@schools)
{
  print $fh "  <school>\n";
  print $fh "    <name>$school->{name}</name>\n";
  print $fh "    <location>$school->{location}</location>\n";
  print $fh "    <type>$school->{type}<type>\n";
  print $fh "    <address>\n";
  for my $address (@{$school->{address}})
  {
    print $fh "      <entry>$address</entry>\n";
  }
  print $fh "    </address>\n";
  print $fh "    <description>$school->{description}</description>\n";
  print $fh "  </school>\n";
}
print $fh "</schools>\n";
close($fh);

jetzt will ich die ergebnisse aber in einer MySQL-DB speichern:

Wir haben die Daten gesammelt im Array %school.

Wenn wir das als Datenquelle nehmen dann müssten wir doch damit weiterkommen: Das ist was ich bis jetzt habe

Code (perl): (dl )

use DBI;
my $dbh = DBI->connect(...);
my $sql_insert = q{
    insert into school_tbl 
    (location, name, type, address, description)
    values
    (?, ?, ?, ?, ?)
};
my $sth = $dbh->prepare($sql_insert);

# Bei jedem Durchgang dann:

$sth->execute(@school{qw{location name type address description}});

$sth->finish();
$dbh->disconnect();

Was müsste ich jetzt noch beachten. Freu ich auf Tipps und Ideen....!

Grüße

//Modedit GwenDragon: Code-Tags repariert
Last edited: 2010-10-17 10:10:16 +0200 (CEST)

+9 replies
topeg

2010-10-17 03:45
User since
2006-07-10
2611 Artikel
BenutzerIn
Code (perl): (dl )

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106

#!/usr/bin/perl use strict; # alles muss definiert sein use warnings; # wenn etwas nicht so ganz richtig ist warnen use diagnostics; # wenn etwas nicht passt ist warnen use File::Find::Rule; # finde Dateien/Verzeichnisse anhand von Regeln use HTML::TokeParser; # parse HTML-Dateien zum leichten auslesen von Daten use DBI; # Das Verzeichnis im dem gesucht werden soll my $search_dir='.'; # ist das aktuelle Arbeitsverzeichnis # die mötigen Werte um dich mit einer Datenbank zu verbinden # ist im Modul alles sehr ausführlich beschrieben # die angefügten Werte sind nur Platzhalter!!! my $dsn="..."; my $user="XXX"; my $password="???"; my $sql_insert = q{ insert into school_tbl (location, name, type, address, description) values (?, ?, ?, ?, ?) }; # Suche nach bestimmten Dateinamen my @files= File::Find::Rule->file() # suche eine Datei ->name('einzelergebnis*.html') # die mit "einzelergebnis" (alles klein geschieben!) beginnt und mit ".html" endet ->in($search_dir); # suche in dem Verzeichnis # das Programm beenden wenn keine Dateien gefunden wurden: unless(@files) { print "Keine Dateien gefunden!\n"; exit; } # mit dem Server verbinden # wie das genau geht steht in der Dokumentation von DBI my $dbh = DBI->connect($dsn, $user, $password, { RaiseError => 1 }) or die($DBI::errstr); my $sth = $dbh->prepare($sql_insert); #gehe alle gefundenen Dateien durch for my $file (@files) { # Ausgabe, damit man weiß waw passiert. print "Bearbeite nun datei: $file!\n"; # Speichrort für die Schuldaten in dieser Datei my %school; # starte seine neue Parser-Instanz mit der Datei als Quelle my $p = HTML::TokeParser->new($file) or die "Can't open $file: ($!)"; #solange ein Tag von Typ 'div' gefunden wird while (my $tag = $p->get_tag('div', '/html')) { # first move to the right div that contains the information last if $tag->[0] eq '/html'; next unless exists $tag->[1]{'id'} and $tag->[1]{'id'} eq 'inhalt_large'; $p->get_tag('h1'); $school{'location'} = $p->get_text('/h1'); while (my $tag = $p->get_tag('div')) { last if exists $tag->[1]{'id'} and $tag->[1]{'id'} eq 'fusszeile'; # get the school name from the heading next unless exists $tag->[1]{'class'} and $tag->[1]{'class'} eq 'fm_linkeSpalte'; $p->get_tag('h2'); $school{'name'} = $p->get_text('/h2'); # verify format for school type $tag = $p->get_tag('span'); unless (exists $tag->[1]{'class'} and $tag->[1]{'class'} eq 'schulart_text') { warn "unexpected format: parsing stopped"; last; } $school{'type'} = $p->get_text('/span'); # verify format for address $tag = $p->get_tag('p'); unless (exists $tag->[1]{'class'} and $tag->[1]{'class'} eq 'einzel_text') { warn "unexpected format: parsing stopped"; last; } $school{'address'} = clean_address($p->get_text('/p')); # find the description $tag = $p->get_tag('p'); $school{'description'} = $p->get_text('/p'); } } # speichere alle gefunden Werte in der DB # das @hash{...} ist ein "HashSlice" $sth->execute(@school{qw{location name type address description}}); } $sth->finish(); $dbh->disconnect();
Aber mal ehrlich, was ist so schwer die beiden Codeteile zusammen zu fügen?
Mich interessiert es wirklich welche Hürde nicht zu überwinden war.
In deinem (möglicherweise an anderer Stelle erfragten Code) steht: # Bei jedem Durchgang dann: Das ist doch eine Anleitung oder zumindest ein Hinweis.
Es fällt mir sehr schwer zu verstehen, wo dabei das Problem war. Die einzelnen Funktionen sind sehr genau in DBI beschrieben. Daraus ließe sich ermitteln, wo im Programmcode diese Platziert werden müssten um korrekt zu funktionieren. Möglicherweise habe ich einen zu großen Abstand zu einem Anfänger, aber ich denke der Begriff "Durchgang" sollte im Zusammenhang mit dem Programmcode, der eine große Schleife hat, die durchlaufen wird, klar sein was gemeint ist. Auch das wo sollte dabei ersichtlich sein, da man die Daten erst in die DB einfügen kann, wenn sie aus dem HTML ausgelesen wurden. Zumindest erwarte ich so etwas bei jemanden, der sagt er beherrsche SQL. Sollte dieses Verständnis nicht vorhanden sein, so Empfehle ich dringend sich dieses absolut nötige Wissen anzueignen, denn ohne das kann man kaum erwarten eine Programmiersprache zu erlernen, oder Programme zu schreiben.
Last edited: 2010-10-17 03:48:03 +0200 (CEST)
- +8 replies
- lin
  
  2010-10-18 00:25
  
  User since
  2010-09-26
  35 Artikel
  BenutzerIn
  
  Hi Topeq
  
  vielen Dank für deine fortgesetzte Hilfe!!!
  
  Grüße
  - +7 replies
  - topeg
    
    2010-10-18 04:33
    
    User since
    2006-07-10
    2611 Artikel
    BenutzerIn
    
    Dennoch würde ich gerne wissen wo bei dir das Problem lag.
    - +6 replies
    - pq
      
      2010-10-18 10:25
      
      User since
      2003-08-04
      12209 Artikel
      Admin1
      
      der db-code stammte aus 865576.
      er lässt sich wie gewohnt die lösungen parallel zusammenbasteln :-/
      
      edit:
      und hier der vollständigkeit halber noch seine anderen threads zum thema:
      
      865576
      865588
      865663
      865774
      Last edited: 2010-10-18 11:22:22 +0200 (CEST)
      Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
      lesen: Wie frage ich & perlintro brian's Leitfaden für jedes Perl-Problem
      - +5 replies
      - lin
        
        2010-10-18 12:50
        
        User since
        2010-09-26
        35 Artikel
        BenutzerIn
        
        hi pq
        
        Kein problem damit! Ich hab ja auch schon auf so etwas gewartet...
        
        By the way: Dass du nach 8419 Artikeln weiter bist als ich nach 30 Artikeln hier, ist ja auch ohne Weiteres einzusehen: Das entspricht dem Verhältnis von 1 : 280
        
        Wundert dich das vielleicht?!
        
        Sorry - ich will dir nicht zu Nahe treten: Aber ich würde mir auch mal gern deinen Anfang ansehen - sagen wir mal...die ersten 10 Threads oder so: Keine Angst - die Mühe mach ich mir nicht. Dazu ist mir die Zeit zu knapp. Bin auch nicht daran interessiert. Ich bin hier um Probleme zu lösen - und auch was zu lernen.
        
        Ich arbeite momentan eben - zugegebenermaßen - über meinem Horizont - habe Real-Live-Aufgaben zu lösen. Da reicht es nicht dass ich mir ca. 7 Bücher zu Perl aus der Bibliothek hole. Ich brauch da eben noch Direkhilfen...
        
        Perl ist ja auch keine unbedingt supereinfache Sprache; Und jetzt nochmals im Ernst: mit PERL, und gleichzeitig einer DB und und und anzufangen ist nun wirklich keine Kleinigkeit...
        
        Als Lehrer hab ich kein Problem damit, wenn jemand Fragen stellt. DU vielleicht... !? Das trau ich dir nicht zu;-)
        
        Grüße aus Süddeutschland!
        Lin
        
        Last edited: 2010-10-18 13:34:41 +0200 (CEST)
        
        topeg
        
        2010-10-18 13:39
        
        User since
        2006-07-10
        2611 Artikel
        BenutzerIn
        
        Nicht das du mich falsch verstehst. Ich möchte helfen, aber um effektiv Helfen zu können ist es wichtig zu verstehen wo das Problem liegt. Und bei deinem Beitrag sehe ich das Problem einfach nicht. Wenn du sagst dass es kein grundsätzliches Problem gab, du nur einfach nur nicht die Zeit oder Lust oder was auch immer hattest eine Lösung zu finden so ist das doch OK. Damit ersparst du mir die Mühe darüber zu grübeln was nun das Problem gewesen sein könnte.
        
        +2 replies
        
        pq
        
        2010-10-18 13:42
        
        User since
        2003-08-04
        12209 Artikel
        Admin1
        
        2010-10-18T10:50:26 lin
        Sorry - ich will dir nicht zu Nahe treten: Aber ich würde mir auch mal gern deinen Anfang ansehen - die ersten 10 Threads: Keine Angst - die Mühe mach ich mir nicht. Dazu ist mir die Zeit zu knapp. Bin auch nicht daran interresiert.
        
        willst du es nun wissen oder nicht? ich hab kein problem damit. musst aber eher im usenet suchen, dieses forum existiert erst seit 2003.
        
        ich hab dann aber auch relativ schnell angefangen, "Programming Perl" zu lesen und daraus zu lernen (zum glück hat mich jemand darauf hingewiesen.
        insofern find ichs immer etwas lächerlich, als fragesteller in einem forum die schiene "du hast auch mal angefangen" zu fahren. klar hab ich auch mal angefangen, und ich hab mich auch nicht immer clever angestellt. aber ich habe programmieren an der uni gelernt, und perl durch bücher und viel *lesen* im usenet und in foren. und das zum grössten teil in meiner freizeit. glaub mir, wenn man immer weiter schnipsel vor die nase gesetzt bekommt, wird man es nicht lernen. ein schnipsel hier und da kann ein anfang sein, eine blockade lösen. aber selbst erarbeiteter code erhöht das verständnis und bleibt eher im hirn kleben.
        
        Quote
        Als Lehrer hab ich kein Problem damit wenn jemand Fragen stellt. DU vielleicht... !?? Das trau ich dir nicht zu.
        
        wie genau kommst du darauf, dass ich ein problem damit habe, dass jemand eine frage stellt?
        was hast du nicht verstanden von dem, was ich schrieb?
        du lässt dir auf perlmonks.org code zusammenstellen, postet diese schnipsel hier und lässt sie dir hier von jemandem zusammenfügen.
        postest dann weiter auf perlmonks.org. und das mittlerweile schon ein paar mal, und du bist dir dazu noch zu schade, wenigstens auf die anderen threads *hinzuweisen*. und das, obwohl ich den letzten thread erst als crosspost markiert hatte. ich dachte, in zukunft machst du das selber.
        
        du kannst natürlich gerne weiterfragen, solange es jemanden gibt, der dir weiter schnipsel zusammenfügt.
        ich wollte nur mal darauf hinweisen, dass ich das unhöflich finde.
        Last edited: 2010-10-18 13:46:27 +0200 (CEST)
        Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
        lesen: Wie frage ich & perlintro brian's Leitfaden für jedes Perl-Problem
        
        lin
        
        2010-10-18 13:52
        
        User since
        2010-09-26
        35 Artikel
        BenutzerIn
        
        Hi pq und topeg
        
        danke für die Beiträge. Freu mich über die!
        
        Auch als "Erstsemester" habe ich das Gefühl dass wir uns verstehen. Das Thema, das Du pq ansprichst ist klar.
        Aber auch für Dich Topeq gilt das. Versteh Deine Fragen. Werde da noch später was schreiben. Wie und warum ich was nicht versteh oder was poste.
        
        @pq - ich glaub dass ich Dich verstehe mit Deinem Anliegen. Ist eben auch nicht leicht - zuzugeben dass man verdammte Anfängerfragen hat. ;-)
        
        Muss jetzt aber in den Unterricht ;-)
        
        Bis später
        lin
        Last edited: 2010-10-18 13:54:23 +0200 (CEST)
        
        pq
        
        2010-10-18 14:04
        
        User since
        2003-08-04
        12209 Artikel
        Admin1
        
        2010-10-18T10:50:26 lin
        habe Real-Live-Aufgaben zu lösen.
        
        ich auch.
        Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
        lesen: Wie frage ich & perlintro brian's Leitfaden für jedes Perl-Problem

View all threads created 2010-10-16 22:43.