#!/usr/bin/perl


sub balisageP{

my $texte="0";

# Si le repertoire nommé Corpus Modif n'existe pas on le crée pour y mettre les textes balisés avec la balise <p>
	if(! -e CorpusModif){ mkdir(CorpusModif) ;}

# pour chaque texte (s'il existe nommé 1 ou 2 ou 3....jusqu'à 100
while($texte<100){

# Le texte balisé aura le même nom que le texte d'origine mais sera mis dans le repertoire CorpusModif
my $texteModif="$texte";

# Si le fichier $texte.txt existe
if (-e "$texte.txt"){

# Ouverture du fichier lu et de celui dans lequel on va écrire
open(LECTURE,"<", "$texte.txt");
open(ECRITURE,">","CorpusModif/$texteModif.txt");

# Lecture du fichier
while($ligne=<LECTURE>){

# A chaque fois qu'il y a un saut de ligne (\n) on ajoute <p> au debut du paragraphe et </p> a la fin du paragraphe (juste avant le saut de ligne)
if($ligne=~m /^(.+)(\n)+/g){
$ligne="<p>".$1."</p>";	

# On fait disparaitre les blancs (\s) qui pourraient être entre le <p> et le début du texte (dû à une tabulation par exemple)
if($ligne=~m /<p>(\s)*(.+)/g){
	$ligne="<p>".$2;

# On supprime tous les <p> </p> sans texte entre les balises (car si on a un saut de ligne sans texte <p> </p> apparaitra dans le texte)
if($ligne=~m /<p><\/p>/g){
	$ligne="";

		

}
}
# On écrit dans le fichier les paragraphes balisé 
print ECRITURE "$ligne\n";
}


else{	print ECRITURE "$ligne";}

}		

}
$texte++;
}

# Fermeture des 2 fichiers
close LECTURE;
close ECRITURE;
}

 
 &balisageP;

