|
|
| <#Th-xy>##© Novembre 2007 Serge Fleury</#Th-xy>
|
<#Th-xy>##SFWeb??#§%</#Th-xy> |
|
|
|
| |
| E-mail: serge.fleury@univ-paris3.fr |
|
<#Th-xy>##CV#Projets??#§%</#Th-xy>
|
 Travaux en cours :
 CFPP2000 : S. Branca-Rosoff, S. Fleury, F. Lefeuvre, M. Pires Discours sur la ville. Corpus de Français Parlé Parisien des années 2000 (CFPP2000) http://ed268.univ-paris3.fr/CFPP2000/
 Séries chronologiques alignées (29/08/2008). Le Monde "en surface" vs Le Monde "profond".
- Exploration textométrique dans une série chronologique constituée de deux volets d'un corpus de presse "alignables" par jour et par article.
 Projet ANR 2006. Textométrie : Fédération des recherches et développements en textométrie autour de la création d’une plateforme logicielle ouverte (Coordinateur : Serge Heiden).
- Le Trameur Programme de génération puis de gestion de la trame et du cadre d'un texte (le métier lexicométrique) pour des opérations lexicométriques (Documentation). Le Trameur intègre le programme treetagger : système d'étiquetage automatique des catégories grammaticales des mots avec lemmatisation. Le Trameur est disponible en 2 versions : la " version Tk " et la "version console".
 mkAlign 2.00 (03/08/2008) ou mkAlign 1.65 (07/09/2007): Le programme mkAlign (offline) permet de construire ou de corriger un alignement de 2 textes puis de produire une version XML du bi-texte aligné. Version exécutable pour Windows. Doc HTML, Doc PDF URL projet : http://tal.univ-paris3.fr/mkAlign/ [Miroir : http://www...sfleury/page3.htm].
 La variation dans les textes
- Repérage de la variation dans les textes par projections lexicométriques sur alignement construit via mkAlign (Janvier 2008). 3 exemples de traitements réalisés : Le texte d'un fil RSS, Deux discours de Ségolène Royal (campagne 2007), Deux discours de Nicolas Sarkozy (conférence de presse 2008)
- "La variation dans les discours" (Février 2007) : repérage de la variation dans les discours "Présidentielles 2007. Application sur 2 versions d'un discours de Ségolène Royal du 11/02/2007.
- "La variation dans les fils" (Mars 2007) : repérage de la variation dans les fils de Presse (mise à jour).
- "La variation dans les fils" (Octobre 2006) : repérage de la variation dans les fils de Presse (i.e fils RSS) (sous-partie du chantier Navigations dans Le Monde). Le journal Le Monde propose sur son site des fils RSS : Les fils RSS sont des flux de contenus gratuits en provenance de sites Internet. Ils incluent les titres des articles, des résumés et des liens vers les articles intégraux à consulter en ligne. Les dernières informations publiées sur Le Monde.fr peuvent ainsi venir enrichir automatiquement votre site Internet ou compléter vos sources d'informations déjà agrégées via un logiciel de lecture des flux RSS.
 Navigations dans Le Monde (Le Monde en Surface vs Le Monde Profond) (Septembre 2006) (accès restreint). Avec en particulier une analyse de la variation textuelle dans "la surface" et dans "la profondeur" du Monde. Période traitée : 17 janvier 2006 au 19 septembre 2006, nombre total de fils : 328 250, variation repérée sur un sous corpus de 500 fils environ.
 Des nuages de mots
 Projets en cours :
 Projet innovant ED268 (2008-2010) : Approche Discursive et Génétique Des Brouillons : les écrits des travailleurs sociaux dans le champ de l’enfance en danger.
 TextoKub (Juin 2006) : Ressources textométriques incrémentales. Chantier en cours.
 Présidentielle 2007
- Navigations dans les "Discours 2007" : l'ensemble des navigations
- Pacte présidentiel vs pacte républicain (3), (2), (1)
- Navigations dans le Fil "Présidentielle 2007"
- Investiture "Présidentielle 2007" (7) : Je/Nous/Vous/Ils
- Investiture "Présidentielle 2007" : mots de candidature (qui s’attirent) (6), (5), (4), (3), (2), (1)
- Information mutuelle dans le Fil "Présidentielle 2007", cartographie des candidats : (4), (3), (2), (1)
- Information mutuelle dans les Fils du Monde, cartographie des candidats : (3), (2), (1)
 Développement de Lexico3
 "Corpus Le Monde Chronologique" : Analyse de Corpus de Veille avec Lexico3
 Fils de Presse : Lectures et traitements lexicométriques sur des fils RSS de journaux en ligne (Le Monde, Libération, Le Figaro)
 Aligneur de Textes : Le programme mkAlign permet de construire et visualiser l'alignement de deux textes en modifiant au besoin la correspondance entre leurs segments respectifs. Ce programme n'est pas uniquement un aligneur automatique. Il appartient à l'utilisateur de construire l'alignement et de définir son degré de précision (résolution). Cette résolution peut varier pour mettre en évidence les correspondances entre les segments textuels de différents niveaux.
 ATONET : le réseau ATONET vise à développer les conditions pour une mise en commun de ressources et de méthodes à des fins d'enseignement et de recherche dans le domaine de l'analyse de corpus textuels
 GADT - "Format des données" : Le groupe GADT-Format des données réunit des chercheurs de la communauté des statistiques textuelles. Le Groupe d'Analyse des Données Textuelles - Format des données est organisé avec le soutien du comité JADT et de la revue Lexicometrica
 wiki (TAL-Lexicométrie) GADT : Wiki du groupe Groupe d'Analyse des Données Textuelles - Format des données réunissant des chercheurs de la communauté des statistiques textuelles
 Projets réalisés :
 Moteur (de requête XPath) pour la constitution européenne : navigation dans un fichier normalisé avec XPath
 Moteur XPath pour la constitution : Avec ce programme, (1) on peut avoir accès à un article donné de la constitution européenne en choisissant dans la liste proposée (par le numéro de l'article), l'article sera affiché dans la zone de résultat , (2) on peut aussi rechercher un article contenant une forme graphique donnée, les articles contenant la forme cherchée seront aussi affichés dans la zone d'affichage des résultats, les lignes contenant la forme seront colorées en rouge... On peut aussi utiliser la version n°2 [l] du moteur qui intègre le dictionnaire des formes graphiques construit par Lexico3 et sélectionner dans ce lexique la forme à rechercher (Attention le chargement de la page est assez long...)
 Projet Innovant ED268 2004-2006 : Propositions de Normalisation pour une Base de Corpus Multimédia à l'ED268
 makeMetadata 2.00 (03/01/2009) : Le programme makeMetadata permet de générer ou de corriger des métadonnées. Version exécutable pour Windows. HTML, Doc PDF URL projet : http://pi-ed268.univ-paris3.fr .
 MkCorpus : Outil de Préparation de Corpus pour Analyse
 GASPAR : Programmation à Prototypes (avec Self) et TALN
 TyPTex : Typologie et Profilage de Textes
 TyPWeb : Typologie et Profilage de sites Web
 SensNet : Catégorisation sémantique des usages et des parcours sur le Web
 Mesures de flux dInternet : Action spécifique CNRS (RTP35)
|
|
| |
|
|
|
|
<#Th-xy>##SFWeb??#§%</#Th-xy>
|
|
| <#Th-xy>##© Novembre 2007 Serge Fleury</#Th-xy>
|
|
|