LRL-Diffusion
Changer le monde, un site à la fois…
Accueil
Alipe
Projet
Documentation
Accès Corpus
Mulce
Voiceforum
Ressources TAL
Sidebar
Menu
Accueil
Alipe
Projet
Documentation
Accès Corpus
Mulce
Voiceforum
Ressources TAL
Cette page permet d'accéder aux différents corpus ALIPE composés d’enregistrements sonores, transcriptions structurées mettant en relief les phénomènes de liaison, métadonnées.
Deux types de corpus sont accessibles :
les corpus distinguables,
les corpus globaux.
Un
corpus distinguable
dans ALIPE correspond à une session d’enregistrement d’interactions orales enfant-parent(s) n’excédant pas une heure. Il est possible de trouver pour le même enfant plusieurs sessions d’enregistrements réalisées dans une même journée.
Un
corpus global
dans ALIPE correspond à l’ensemble des corpus distinguables associés à un enfant.
FORMATS DES FICHIERS DISPONIBLES
Les corpus ALIPE sont disponibles dans deux formats de structuration : le format XML-TEI et le format CHAT (Codes for the Human Analysis of Transcripts) permettant l’analyse de corpus via le programme CLAN (Computerized Language ANalysis). Pour plus d’informations sur ces formats de structuration, voir l’onglet «
Documentation
».
Les fichiers permettant la lecture en flux continu (« streaming ») des fichiers sonores anonymisés sont également disponibles en téléchargement.
RECHERCHE DES CORPUS
La base de corpus Alipe contient actuellement 12h 50mn de dialogue et 90 616 mots.
Les fichiers de ce corpus sont maintenant disponibles et de manière pérenne sur l'équipement d'excellence
Ortolang
.
Ils sont accessibles via ce
permalien
:
http://hdl.handle.net/11041/alipe-000853
Type de corpus
Tous
Global
Distinguable
Age de l'enfant (mois)
Tous
28-36
36-44
40-48-64
28
36
40
44
48
64
Prénom de l'enfant
Tous
prune
salome
Le contenu de cette banque de corpus est sous
Licence Creative Commons
.
Accueil
Alipe
Projet
Documentation
Accès Corpus
Mulce
Voiceforum
Ressources TAL