Introduction
Pour
sa septième édition, CIDE s'intègre dans
la semaine du Document numérique (SDN). Pour chacune
des éditions de CIDE le comité de conférence
choisi de focaliser le débat sur une thématique
particulière qui, au-delà des communautés
établies, des disciplines scientifiques et des démarches
spécifiques, témoigne des problèmes et
des enjeux de cette objet de recherche : le document électronique.
Pour cette édition, le thème des approches sémantiques
du document électronique a été retenu.
Nous reprendrons ici les attendus des contributions :
La
mise en avant du « sens » a en effet longtemps
été regardée avec beaucoup de scepticisme
au profit de traitements dits « de surface »,
s'attachant à « la forme » par opposition
au « contenu ». Cette perception est en train
de changer. Des progrès significatifs ont été
réalisés au cours des dernières années,
d'abord sur le document textuel (extraction d'informations,
question answering, résumé automatique...),
puis relayés de plus en plus dans les autres médias
(extraction d'information et indexation de documents sonores
et vidéo par le contenu, résumé d'oeuvres...).
Par ailleurs, les travaux déployés autour du
thème du « web sémantique » visent
à décrire le contenu des documents ou ressources
de toutes sortes de manière à les rendre accessibles
et interopérables.
Un
autre point de vue, plus radical, serait de considérer
que même les traitements dits « de surface »
ou « numériques » sont en fait, à
y bien regarder, sémantiques. Si le « sens »
ne se réduit pas à « l'information »,
produire de l'information, n'est-ce pas produire du sens ?
Un désambiguïseur utilisant une méthode
statistique, même si la méthode ne se réclame
d'aucune théorie linguistique, résout bien une
ambiguïté sémantique lexicale. Un segmenteur
thématique va repérer des récurrences
lexicales que d'autres appelleront isotopies. Un extracteur
de descripteurs thématiques produit bien ce sens minimal
: « de quoi parle ce document », etc.
On
le voit, l’appel était volontairement ouvert,
laissant aux auteurs toute latitude pour décliner à
leur guise le terme « sémantique », en
fonction de leurs propres objectifs et méthodes de
recherche. |
Sommaire
Conférences
de synthèse
Actualité d’une approche sémantique du
document numérique. P. Enjalbert, M. Gaio
Du corpus à l’hypertexte. G. Vignaux
Description des contenus musicaux et applications. H. Vinet
Session
1. Structuration de documents
Exploitation de ressources lexicales pour la mise en hypertexte.
F. Cerbah
Validation par prototypage d’un modèle de segmentation
des documents techniques composites. A. Smolczewska, G. Lallich-Boidin
Schema matching for Semantic Reuse of XML documents. A. Boukottaya,
C. Vanoirbeek
Session
2. Analyse textuelle
Pour une recherche semi automatisée des topoï
narratifs. G. Lessard, S. Sinclair, M. Vernet, F. Rouget,
E. Zawisza, E. Fromet de Rosnay, E. Blumet
Expériences lexicométriques sur les cooccurrences.
J.M. Leblanc
Session
3. Organisation et exploration de corpus documentaires multimédia
Expression du point de vue des lecteurs dans les
bibliothèques numériques spécialisées.
A. Bénel
D’un corpus d’images à une base d’images
: une plateforme combinant syntaxe et sémantique et
une méthodologie de prototypage. L. Besson, A. Da Costa,
E. Leclercq, M.N. Terrasse
CEDERILIC : constitution d’un livre et d’un index
numériques. J. Charlet, T. Aït el Mekki, D. Bourigault,
A. Nazarenko, R. Teulier, B. Toledano
Un mode de mise en scène théâtrale directement
inspiré de la fouille interactive de données
numériques. A. Bonardi, F. Rousseaux
Session
4. Sémantique linguistique et applications documentaires
Sémantique interprétative appliquée
à la détection automatique de documents racistes
et xénophobes sur Internet. M. Valette
Modèle sémantique et interactions pour l’analyse
de documents. V. Perlerin, S. Ferrari
Quelques contenus généraux au service des documents.
D. Dutoit, P. de Torcy, Y. Picand
Les documents auto-explicatifs : une voie pour offrir l’accès
au sens aux lecteurs. H. Blanchon, C. Boitet
Session
5. Indexation et recherche d’information
Analyses sémantiques pour la navigation textuelle.
E. Crestan, C. de Loupy, L. Manigot
Sélection des traits et catégorisation thématique
dans un corpus de pages personnelles Web. M. Hurault-Plantet
|