Secteur TAL Informatique

ILPGA Université Paris 3

Cours Module L8T06 "Documents structurés" (Master TAL 1/2) TAL Paris 3 - ILPGA / Paris X / INALCO

Responsable du cours

Fleury Serge. serge.fleury@univ-paris3.fr

Descriptif du cours

Les textes sont des documents structurés. Un article comporte un titre, un ou des auteur(s), des sections, une bibliographie. La présentation permet d'appréhender cette structure (taille des caractères, jeu sur le gras, etc.). Lorsqu'on rend explicite cette structure (par le moyen de balisages en XML), on peut manipuler le texte comme unité structurée (extraire automatiquement les titres pour une table des matières, chercher les paragraphes introductifs, etc.). Le cours présente la manière de rendre explicite et fiable la structure des documents (en les assortissant d'une " grammaire textuelle " dite DTD). Il aborde les transformations réglées de textes qui deviennent possibles.
Bibliographie P. Bonhomme, " Codage et normalisation de ressources textuelles ", in Ingénierie des langues, J.-M. Pierrel (ed), p. 173-192, Hermès Science, 2000, Paris.
Ressources pour ce cours disponibles sur Agora : L8T06
Voir aussi infra

Ressources pour le cours

Disponibles sur la plateforme AGORA (cours L8T06) (me demander les identifiants)

Liens (archives ou liens externes)

Contrôle des connaissances

Pour ce module, en contrôle continu, il faudra traiter et rédiger le travail réalisé en TD (par groupe de 2) : TD XML, XSLT; XPATH, DOCBOOK, TEI, METADONNEES... Ce TD doit conduire à la réalisation d’un site WEB regroupant les manipulations et résultats produits en réponse aux questions posées dans le cadre de ce TD (les exercices à faire sont décrits dans le poly distribué en cours ou disponible sur AGORA). IMPORTANT : toutes les pages constituant ce site devront être au format XML (avec des feuilles de style XSLT pour paramétrer l’affichage).

Bibliographie

De nombreux documents seront distribués en cours ou seront disponibles sur la plateforme Claroline.

Ouvrages de référence

Chalumeau François XML : un langage universel pour la représentation textuelle des données structurées, Biblio Numériques, cours INRIA, ADBS éditions, 2000

Hancke Johann-Christian "XML pour débutants", Compétence Micro – Expérience, Juillet 2002, Ref. : 4402

Michard Alain XML, langage et applications, Editions Eyrolles, 1999

Petrausch Andréas GUIDEXPRESS XML, Editions Micro Application, 2000

Pierrel Jean-Marie Ingénierie des langues  Traité IC2 -Série informatique et SI360 pages - 01/10/00 - ISBN : 2-7462-0113-5 HERMES

Ray Erick T., Christopher R. Maden, "Learning XML", édition O'Reilly, ISBN 0-596-00046-4, 2001.

Sandoval Victor SGML - Ecole Centrale de Paris HERMES

Scott Means W., Elliotte Rusty Harold, "XML in a nutshell"(traduction française) O'Reilly

 Autres références :

·       Pillou, Jean-François. Introduction à XML [En ligne]. http://www.commentcamarche.net/xml/xmlintro.php3?imprim=1 (Page consultée le 30 janvier 2002)

·       Cover, Robin. The XML Cover Pages - Home Page [En ligne]. http://xml.coverpages.org (Page consultée le 14 janvier 2002)

·       Project Gutenberg. Projet Gutenberg official home site - index -- Free Books On-Line [En ligne]. http://promo.net/pg (Page consultée le 14 janvier 2002)

·       The World Wide Web Consotrium. The World Wide Web Consortium [En ligne]. http://www.w3.org (Page consultée le 14 janvier 2002)

·       Université Laval. Bibliothèque. Comment citer un document électronique? [En ligne]. http://www.bibl.ulaval.ca/doelec/citedoce.html (Page consultée le 13 janvier 2002)

·       xmlhack. XML developer news from XMLhack: by and for the XML community [En ligne]. http://www.xmlhack.com (Page consultée le 11 janvier 2002)

·       Bray, Tim et al. Extensible Markup Language (XML) 1.0 (Second Edition). W3C Recommendation 6 October 2000 [En ligne]. http://www.w3.org/TR/2000/REC-xml-20001006 (Page consultée le 12 janvier 2002)

·       Brochard, Jonny. XML : concept et mise en oeuvre. Nantes : Éd. ENI, c2001. (En réserve à la bibliothèque)

·       Michard, Alain. XML : langage et applications. Paris : Eyrolles, 2000. xv, 499 p. (ISBN: 2-212-09206-7) (En réserve à la bibliothèque)

·       The Unicode Consortium. Unicode Home Page [En ligne]. http://www.unicode.org(Page consultée le 14 janvier 2002)

·       Clark, James. Associating Style Sheets with XML documents. Version 1.0 [En ligne] http://www.w3.org/TR/xml-stylesheet (Page consultée le 30 janvier 2002)

·       W3C. Cascading Style Sheets, level 2: CSS2 Specification. W3C Recommendation 12-May-1998 [En ligne] http://www.w3.org/TR/REC-CSS2 (Page consultée le 11 décembre 2001)

·       W3C. Les feuilles de style en cascade, niveau 2: Spécification CSS2. Recommandation du W3c du 12 mai 1998 (traduction française de: Cascading Style Sheets, level 2: CSS2 Specification. W3C Recommendation 12-May-1998) [En ligne] http://www.yoyodesign.org/doc/w3c/css2/cover.html (Page consultée le 19 révrier 2002)

·       Consultez la partie 2 Introduction à CSS2 pour un bref tutoriel sur les feuilles de style.

·       w3schools. CSS Tutorial [En ligne] http://www.w3schools.com/css/default.asp (Page consultée le 18 février 2002)

Liens

Portail TAL - P3 : cours, Tds, outils...

PLURITAL : Filières TAL et ingéniérie linguistique de Paris III Sorbonne nouvelle, Paris X Nanterre, INALCO (Institut National des langues et civilisations orientales)- Apports croisés, complémentaires et pluriels pour le TAL

Rechercher une entrée du TLFi :

 

Rechercher une entrée du XMLittré :