Python rockz! - #23740 (Sonstige Beiträge (auch Spaß und Sinnloses))

pktm

2007-06-03 17:08

User since
2003-08-07
2921 Artikel
BenutzerIn

Hallo!

Ich dachte mit, ich beglÃ¼cke euch auch mal mit der Erkenntnis, dass Python einfach besser ist.

In meinem Kurs zu statistischen Methoden in der CL wurde dieses Semester auf Python gewechselt, weil

Quote
1. whitespace: nesting lines of code; scope
2. object-oriented: attributes, methods (e.g. line)
3. readable

und dem eigentlichen Grund (und das ist der einzig gute Grund): nltk, ein Toolkit zur Verarbeitung natÃ¼rlicher Sprache.

Aber weil man sowas nicht einfach zugeben kann wurde noch ein objektiver Vergleich zwischen Perl und Python heran gezogen:

Code: (dl )

Python example

import sys
for line in sys.stdin.readlines():
    for word in line.split():
        if word.endswith(&â€™ing&â€™):
            print word

Code: (dl )

Perl exapmle

while (<>) {
    foreach my $word (split) {
        if ($word =~ /ing$/) {
            print "$word\n";
        }
    }
}

Zu Perl gibts dann och die uns allen bekannten SchwÃ¤chen:

Quote
1. syntax is obscure: what are: <> $ my split ?
2. &âit is quite easy in Perl to write programs that simply look like raving gibberish, even to experienced Perl programmers&â (Hammond Perl Programming for Linguists 2003:47)
3. large programs difficult to maintain, reuse

Auf jeden Fall ist Python besser, wie ich jetzt festgestellt habe. Denn, im letzten Kurs wurde dieses tolle StÃ¼ck Kode erschaffen um Buchstaben-Ngramme zu erstellen:

Code: (dl )

def ngram(n, file):
 Â  Â  Â  Â text = open(file).read()

 Â  Â  Â  Â # n-1 Leerzeichen vor und nach Text einfuegen
 Â  Â  Â  Â text = (n-1)*' ' + text + (n-1)*' '

 Â  Â  Â  Â # Zaehler initialisieren
 Â  Â  Â  Â C_h = {} Â  Â # Zaehler fuer Kontext/History 
 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â # Â (z.B. bei Trigram: Â C(w1 w2) Â  Â  )
 Â  Â  Â  Â C_ngr = {} Â # Zaehler fuer Ngram
 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â # Â (z.B. bei Trigram: Â C(w1 w2 w3) Â )
 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â # Â dictionary ueber Tupel aus h und letztem w
 Â  Â  Â  Â vocab = {} Â # Vokabular (dictionary mit Zaehlern)

 Â  Â  Â  Â # Fenster von n Zeichen ueber den Text schieben
 Â  Â  Â  Â for Ngram in [ text[i:i+n] for i in range(len(text)-n+1)]:
 Â  Â  Â  Â  Â  Â  Â  Â # print 'Ngram: ' + Ngram
 Â  Â  Â  Â  Â  Â  Â  Â (h, w) = (Ngram[:-1],Ngram[-1:])

 Â  Â  Â  Â  Â  Â  Â  Â if w not in vocab:
 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â vocab[w] = 0.0
 Â  Â  Â  Â  Â  Â  Â  Â vocab[w] += 1

 Â  Â  Â  Â  Â  Â  Â  Â # Zaehler erhoehen (bzw. wenn noetig zuerst initialisieren)
 Â  Â  Â  Â  Â  Â  Â  Â if h not in C_h:
 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â C_h[h] = 0.0
 Â  Â  Â  Â  Â  Â  Â  Â C_h[h] += 1
 Â  Â  Â  Â  Â  Â  Â  Â 
 Â  Â  Â  Â  Â  Â  Â  Â if (h,w) not in C_ngr:
 Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â C_ngr[(h,w)] = 0.0
 Â  Â  Â  Â  Â  Â  Â  Â C_ngr[(h,w)] += 1

 Â  Â  Â  Â # Ergebnis: Tupel aus n und dictionaries von Zaehlern
 Â  Â  Â  Â return (n, C_h, C_ngr, vocab)

Besonders gut hat mir dabei das ohne weiteres zu lesende Kostrukt hier gefallen:

Code: (dl )

1
2
3

# Fenster von n Zeichen ueber den Text schieben
for Ngram in [ text[i:i+n] for i in range(len(text)-n+1)]:
    (h, w) = (Ngram[:-1],Ngram[-1:])

Das ist gleich viel leserlicher (fÃ¼r jemanden, der Python kann versteht sich)!

Ich bin ja mal echt gespannt wer das am Ende des Kurses so alles gut findet.

Ich hoffe, wir kommen noch von unseren AnfÃ¤nger-SchwÃ¤chen weg. So ist es z.B. unschÃ¶n die verwendeten Variablen zu deklarieren (wenn man das so nennen mÃ¶chte). Dazu aus einem Python-Forum (http://forum.ubuntuusers.de/topic/78874/):

Quote
Die Frage ist, wie oft man solche Fehler [tipfhlr] macht, und ob das die Zeit rechtfertigt fÃ¼r alle Namen, bei denen man den Fehler nicht macht eine Deklaration vornehmen zu mÃ¼ssen.

AuÃerdem kommen wir den empfohlenen 50 Zeilen Kode pro Methode schon verdÃ¤chtig nahe...

Aber ich gebe nicht auf. Als jemand dem Perl gut gefÃ¤llt habe ich zwar so meine Probleme in Python rein zu kommen, aber es ist durchaus machbar. Ich vermisse die regulÃ¤ren AusdrÃ¼cke in bischen, dafÃ¼r kann ich aber Strings als Objekte ansprechen. Nur Listen haben keine length() - Methode. DafÃ¼r gibt es len(Liste).

Nun gut, es wird schon gehen - bis zum Semesterende.
GrÃ¼Ãe, pktm

http://www.intergastro-service.de (mein erstes CMS :) )