LRL-Diffusion

Changer le monde, un site à la fois…

Sidebar
Menu
Cette page permet d'accéder aux différents corpus ALIPE composés d’enregistrements sonores, transcriptions structurées mettant en relief les phénomènes de liaison, métadonnées.
Deux types de corpus sont accessibles :
  • les corpus distinguables,
  • les corpus globaux.
Un corpus distinguable dans ALIPE correspond à une session d’enregistrement d’interactions orales enfant-parent(s) n’excédant pas une heure. Il est possible de trouver pour le même enfant plusieurs sessions d’enregistrements réalisées dans une même journée.
Un
corpus global dans ALIPE correspond à l’ensemble des corpus distinguables associés à un enfant.

FORMATS DES FICHIERS DISPONIBLES
Les corpus ALIPE sont disponibles dans deux formats de structuration : le format XML-TEI et le format CHAT (Codes for the Human Analysis of Transcripts) permettant l’analyse de corpus via le programme CLAN (Computerized Language ANalysis). Pour plus d’informations sur ces formats de structuration, voir l’onglet «
Documentation ».
Les fichiers permettant la lecture en flux continu (« streaming ») des fichiers sonores anonymisés sont également disponibles en téléchargement.

RECHERCHE DES CORPUS

La base de corpus Alipe contient actuellement 12h 50mn de dialogue et 90 616 mots.
Les fichiers de ce corpus sont maintenant disponibles et de manière pérenne sur l'équipement d'excellence Ortolang.
Ils sont accessibles via ce
permalien : http://hdl.handle.net/11041/alipe-000853










Licence Creative Commons This material is Open Data
Le contenu de cette banque de corpus est sous Licence Creative Commons .