Thread Probleme beim splitten mit RegEx (5 answers)
Opened by Lebewesen at 2013-06-26 17:13

Lebewesen
 2013-06-26 17:13
#168605 #168605
User since
2011-09-09
62 Artikel
BenutzerIn

user image
Hallo,

ich will Kapitel von Texten in kleinere Abschnitte teilen. Allerdings gehen mir teilweise Absätze "verloren". Wenn der Absatz nicht großgenug ist, wird er ignoriert - das will ich natürlich nicht, allerdings fällt mir nicht ein, wie ich das ganze besser machen könnte...

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
use Data::Dumper;
$text="1Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor.
2Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus.
3Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim.
4Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu.
5In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium.
6Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus.
7Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim.
8Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet.
9Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi.
10Nam eget dui. Etiam rhoncus.
11Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum.
12Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus.
13Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris sit amet nibh. Donec sodales sagittis magna. Sed consequat.L
14eo eget bibendum sodales, augue velit cursus nunc.";

my $splitSize=100; #Die Größe wird je nach Text automatisch angepasst.
my @split = $text =~ m%((?:\A|^).{$splitSize,}?(?:$|\Z))%gcsm;

print Dumper(\@split)

View full thread Probleme beim splitten mit RegEx