|< 1 2 >| | 16 Einträge, 2 Seiten |
Dieser Zeichensatz enth=E4lt die schriftspezifis=chen Zeichen f=FCr westeurop=E4ische und amerikanische Sprachen. Der Zeichensatz= deckt die Sprachen Albanisch, D=E4nisch, Deutsch, Englisch, F=E4r=F6isch, Finnisc= h, Franz=F6sisch, Galizisch, Irisch, Isl=E4ndisch, Italienisch, Katalanisch, Niederl=E4ndisch, Norwegisch, Portugiesisch, Schwedisch und Spanisch ab. Lediglich einzelne Zeichen. Wie das niederl=E4ndische "ij" oder die deutschen Anf=FChrungszeichen.
Dieser Zeichensatz enthõlt die schriftspezifishen f³r westeuropõische und amerikanische Sprachen. Der Zeichensatz= deckt die Sprachen Albanisch, Dõnisch, Deutsch, Englisch, Fõr÷isch, Finnisc= h, Franz÷sisch, Galizisch, Irisch, Islõndisch, Italienisch, Katalanisch, Niederlõndisch, Norwegisch, Portugiesisch, Schwedisch und Spanisch ab. Lediglich einzelne Zeichen. Wie das niederlõndische "ij" oder die deutschen Anf³hrungszeichen.
binmode(STDOUT, ":encoding(cp437)")
Dieser Zeichensatz enthält die schriftspezifischen Zeichen für westeuropäische und amerikanische Sprachen. Der Zeichensatz= deckt die Sprachen Albanisch, Dänisch, Deutsch, Englisch, Färöisch, Finnisc= h, Französisch, Galizisch, Irisch, Isländisch, Italienisch, Katalanisch, Niederländisch, Norwegisch, Portugiesisch, Schwedisch und Spanisch ab. Lediglich einzelne Zeichen wie das niederländische "ij" oder die deutschen Anführungszeichen unten fehlen.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#!/usr/bin/perl
use strict;
use warnings;
use MIME::Parser;
# In dieser Datei liegt der Quelltext der Mail
my $mimemail = 'mimemail.txt';
# Parser anlegen
my $parser = MIME::Parser->new() or die "cannot create parser object: $!";
# Mail parsen, MIME::Entity zurueck erhalten
my $entity = $parser->parse_open($mimemail) or die "cannot parse $mimemail: $!";
# Gibt es mehrere Parts?
my @parts = $entity->parts();
# Wenn nicht, nimm $entity selber als Part
push @parts, $entity unless @parts;
# Dekodiere alle Parts
my $num = 1;
for my $part (@parts) {
print "### Teil $num hat den Typ ", $part->effective_type(), "###\n";
print "### Header von Teil $num ###\n", $part->head()->as_string, "### Ende Header Teil $num ###\n";
# bodyhandle() liefert uns ein MIME::Body Objekt mit dem Inhalt des Parts
my $bh = $part->bodyhandle();
unless ($bh) {
print "### Teil $num hat keinen Body ###\n";
}
print "### Dekodierter Inhalt Teil $num ###\n", $bh->as_string, "### Ende Teil $num ###\n";
++$num;
}
Quote2) Welche Kodierungs-Verfahren gibt es und kann man überhaupt alles abfangen?
Quote3) Wenn ich das Kodierungsverfahren "QuotedPrintable" bei einer 7-bit Verschlüsselung (also mit ASCII Zeichensatz) anwende (im Beispiel ist 8-bit angegeben), kriege ich trotzdem kein brauchbares Ergebnis. Was muss ich ändern?
print "Content-Type: ", $entity->head()->get('content-type');
QuoteUnd kann ich mich auf einen festlegen, als z.B. immer den 1., wenn ich nichts anderes will, als nur den Betreff und den Body?
QuoteWieviel Entity-Parts kann so ne Mail denn haben?
QuoteBeliebig viele, AFAIK.
QuoteUnd kann ich mich auf einen festlegen, als z.B. immer den 1., wenn ich nichts anderes will, als nur den Betreff und den Body?
QuoteDu meinst indem ich einer Mail keinen Body-Text mitgebe? Klar, kann ja auch Mails ohne Daten raushauen. In dem Fall hab ich halt nen leeren Body, den ich auch verwerten würde zusammen mit den restlichen Daten. Oder ich fange leere Felder vorher ab. Trotz allem möchte ich sie aber auslesen aus der Mail.Body ist alles, was nach dem Header kommt. Und eine Mail muss ueberhaupt keinen "textuellen Inhalt" haben, wenn du das meinst. Ich kann auch eine MIME-Mail verschicken, die nur aus einem Binaeranteil besteht.
QuoteBleibt die Frage wie sowas zustande kommt (Aufteilung der Mail in mehrere Entity-Parts und die unterschiedlichen Zeichensätze)? Und es bleibt die Frage wie wahrscheinlich sowas ist. Ich will ja keinen eMail-User-Agent proggen und da eigentlich keinen riesigen Aufwand reinstecken.Ein anderes Problem ist, dass durchaus ein einzelner Mailtext aus mehreren MIME-Parts bestehen kann! Mutt macht sowas gerne, wenn unterschiedliche Teile unterschiedliche Zeichensaetze benoetigen. Da kann es also sein, dass ein MIME-Part US-ASCII ist, der naechste dann ISO-8859-1 und der wiederum naechste ISO-8859-15. Alle hintereinander gehaengt bilden den Text der Mail. Damit kommt nichtmal jeder User Agent klar.
QuoteKlar, daran mache ich ja aus, ob ich es verwerten kann oder nicht.Ein Kriterium fuer die Auswahl ist natuerlich, was Content-type und Content-Disposition sagen. Wenn die Content-Disposition "attachment" ist, oder der Content-type etwas anderes als "text/*", dann gehoert es wohl nicht zum textuellen Inhalt der Mail.
|< 1 2 >| | 16 Einträge, 2 Seiten |