Stèles

de Victor Segalen

page Segalen - texte de Stèles Index hiérarchique
 
TABLEAU DES FRÉQUENCES


(Voir ci-dessous pour la lecture du tableau)
 
PARTIE 
FORMES
OCCURRENCES
RÉPÉTITIVITÉ
Préface 
638 17,8%
1374 11,2%
2,15
Midi 
1153 32,2%
2739 22,3%
2,38
Nord 
503 14%
1108 9%
2,2
Orient 
686 19,2%
1544 12,6%
2,25
Occident 
437 12,2%
842 6,8%
1,93
Chemin 
533 14,9%
1061 8,6%
1,99
Milieu 
953 26,6%
2069 16,8%
2,17
Annexes 
751 21%
1539 12,5%
2,05
TOTAL 
3581
12276
3,43
MOYENNE
447
1535
3,43

 

LECTURE DU TABLEAU DES FREQUENCES :
    La première colonne donne la liste des parties du recueil Stèles, de Victor Segalen, sauf les deux dernières lignes. Les titres des différentes parties ont été réduits au strict nécessaire.

    La deuxième colonne indique, pour chaque partie, le nombre de formes lexicales qu'elle contient. Par exemple, "voie" et "voies" sont deux formes différentes, donc comptées séparément si elles apparaissent dans le texte. Mais "voie" est UNE forme, quel que soit le nombre de fois où elle sera rencontrée DANS LA PARTIE concernée. Par contre, même si cette forme est présente dans plusieurs parties du recueil entier, elle ne sera comptée qu'une fois dans le TOTAL. Dans cette colonne, le nombre de formes est suivi d'un pourcentage en caractères réduits, il s'agit du pourcentage de formes lexicales que contient chaque partie par rapport au TOTAL. Pour la raison qui vient d'être expliquée, le total des formes des parties n'est pas égal au nombre total de formes du recueil, et la somme des pourcentage n'a pas à être égale à 100. La ligne de MOYENNE indique un chiffre théorique (nombre total divisé par le nombre de parties) que l'on pourra comparer avec le chiffre réel de chaque partie afin de noter les écarts les plus forts : "Occident" et "Nord" sont visiblement moins fournis que "Midi" et "Milieu" (mais cette information ne peut être qu'un début de prémice d'analyse...)
    La troisième colonne donne le nombre d'occurrences des formes dans les différentes parties, ainsi que le nombre total d'occurrences. Le nombre d'occurrences de toutes les formes, dans une partie, indique exactement sa longueur. Pour une forme donnée, en continuant l'exemple précédent : si la forme "voie" est répétée 5 fois dans une partie, elle a 5 occurrences. Chaque forme est présente au moins une fois (1 occ.) et certaines formes ("et", "le", "que", etc.) sont répétées des dizaines ou des centaines de fois, en général sans que le lecteur humain n'y prête attention. Le pourcentage qui suit le nombre d'occurrences est la part que représente la partie dans l'ensemble du recueil. Cette fois, la somme des occurrences des différentes parties doit donner le nombre TOTAL d'occurrences, et les pourcentages s'additionnent jusqu'à 100. La ligne de MOYENNE est, ici aussi, théorique et doit servir à la comparaison raisonnée. Là aussi "Midi" et "Milieu" se présentent très différemment de "Nord" et "Occident".
    Enfin, la quatrième colonne, indique la répétitivité moyenne des formes dans chaque partie, et, en bas, au total ou en moyenne. C'est la division du nombre d'occurrences par le nombre de formes. Dans un corpus aussi réduit (en volume) que Stèles, cette information est à peu près inutile. Dire qu'en moyenne, les formes sont répétées 2 fois, ou 2,6 fois ne présente aucun intérêt (il en irait autrement si une partie affichait 24 et l'autre 3...)

    Les chiffres contenus dans ce tableau n'ont donc d'intérêt qu'à être utilisés pour la comparaison ou la pondération avec d'autres chiffres, issus d'autres corpus, ou provenant de l'index hiérarchique dans lequel on souhaiterait étudier précisément certaines formes.

@Hubert de Phalèse, 1999