

Serge Fleury TD L3I01 2005-2006
1. DICTIONNAIRE

VOICI LE CORPUS SUR LEQUEL NOUS ALLONS TRAVAILLER

Pour utiliser la commande egrep sur notre fichier duchn.txt, il faut auparavant se situé dans le fichier en utilisant la commande cd.
Voici les résultats de la question 1

Voici les réponses à la question 2.

Il y a 162 lignes

Voici les résultats :

Il y a 304 lignes contenant un mot commençant par « bougre ».

Voici les résultats de la question 4.
Il y a 524 lignes qui contiennent un mot commençant par « sans culottes ».

Voici la réponse à la question 5.

Il y a 3077 lignes qui contiennent une majuscule.

Voici les résultats de la question 6.
Nous avons recherché les mots parlant de "danger" et qui commence soit par une majuscule soit une minuscule.

Voici les réponses à la question 7

Il y a 25 lignes parlant de "danger"

Voici les réponses qui parlent de " patrie "

Il y a 300 lignes parlant de partie.

Voici les réponses qui parlent de " liberté"

Il y a 231 lignes contenant un mot parlant de liberté

Il y a 228 Lignes contant le mot liberté et 3 avec le mot libertin

Voici les réponses de la question 10
D'après les réponses, on a l'occurrence de l'expression ' il est « temps » 6 fois dans le fichier.

Sens du mot « temps » selon son contexte :
-
qu'en même temps tous les hommes en état
L’expression « en même temps » signifie dans le même moment, simultanément.
-
dans toutes les armées; de tout temps, il y a
L’expression « de tout temps » signifie toujours.
-
qui a été greffé à temps, dont les rameaux ont
Dans cette expression, « temps » exprime le moment favorable à telle ou telle action.
-
*petion , dans le temps où il était l'idole
Le mot temps ici se réfère à une époque bien déterminée.

Le résultat de ce filtrage est un fichier vide

Il n’y a aucune ligne dans le fichier duchn.txt qui parle de « république ».

Voici le résultat du filtrage des lignes parlant de « trahison ».

Dans le fichier duchn.txt, il y 71 lignes qui parlent de trahison.

Voici les réponses répondant à la question 13.
Question n°1 :Combien de mots dans le fichier ?

Dans ce fichier, il y a 138257 mots, 138257 lignes et 1524757 bites.
Question n°2 Avec la commande egrep extrayez les mots se terminant par -able. (Indiquez la ligne de commande).

Dans ce fichier, il y a un mot par ligne d'où cette commande egrep. Voici les réponses.
Question n°3 Combien y a-t-il de mots terminés par -able ? A quelle(s) partie(s) du discours sont-ils rattachés ?

Il y a 497 mots terminés par –able.
La plupart de ces mots appartient à la classe des adjectifs. Il existe quelques exceptions comme le mot "accable" qui est un verbe conjugué à la 1ere ou à la 3ème personne du singulier du présent.
Question n°4 Même question pour -eux.

Voici les mots se terminant par –eux. Il y en a 369. Les différentes classes de ces mots sont: des adjectifs (comme : affectueux), des noms au pluriel (comme : aveux), des noms composés (comme : sèche-cheveux), des déterminants (comme: deux, ceux), des pronoms (comme: eux) des verbes conjugués (comme : peux)
Question n°5 Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:

Voici les résultats des mots se terminant par –able et –ible.

-
Canoë
-
Golf
-
Judo
-
Kayak
-
Natation
Voici l’arborescence que nous avons créé pour
décrire ces données.