Date de mise en ligne: 03/08/2021 (+ photo ajoutée le 26/11/2021).

    LfPC : Aidez la science en participant à un recueil d'enregistrements audio/vidéo

Qui sommes-nous ?

Brigitte Bigi


Chercheure au CNRS au Laboratoire Parole et Langage d'Aix-en-Provence, son travail porte essentiellement sur l'enrichissement automatique de données audio et/ou vidéo et l'analyse de ces enrichissements, communément appelés annotations.

Depuis 2014, l'intégralité de son travail est distribué sous la forme d'un logiciel sous licence libre : http://sppas.org

Vous trouverez ici la présentation du 24 août, lors du stage organisé par l'ALPC, ou ici en version imprimable.

Maryvonne Zimmermann


Membre des associations ALPC et Datha.


Carine André


Membre du Centre d'Expérimentation sur la Parole du Laboratoire Parole et Langage, Carine apporte son soutien technique lors du recueil des données.


Pourquoi avons-nous besoin de vous enregistrer ?

Les données que nous allons collecter serviront notamment à générer automatiquement les clés LfPC d'une vidéo, avec l'audio et la transcription orthographique, sous la forme de réalitée augmentée. Le système actuel (août 2021) permet d'afficher un numéro de clé sur le visage au moment de sa réalisation acoustique. Voir la vidéo de démo. Cette vidéo montre qu'il est nécessaire d'analyser le codage humain pour pouvoir ensuite le faire reproduire par un système automatisé.

Pour pouvoir afficher automatiquement la main qui forme la clé, ainsi que les transitions entre les différentes clés, il est nécessaire d'étudier rigoureusement ces mouvements lorsqu'ils sont effectués par des codeurs. Il est donc nécessaire de disposer d'enregistrements spécifiquement créés pour cette tâche d'analyse.

En quoi consiste un enregistrement ?

Un enregistrement se divise en 4 sessions. Chacune de ces sessions consiste à lire à voix haute et à coder en LPC le texte qui est présenté, selon le thème choisi. La première session est une lecture de syllabes, la deuxième une lecture de mots, la troisième une lecture de phrases et la quatrième une lecture d'un texte court.

Et si vous faite une erreur de codage ?

Ce n'est pas grave ! Au moment d'analyser les codages, cette partie sera ignorée.

Combien devrez-vous faire d'enregistrements ?

Nous avons préparé 10 thèmes différents. Nous vous demandons d'effectuer la lecture et le codage d'un thème. Cependant, si vous souhaitez contribuer davantage, vous pourrez enregistrer plusieurs thèmes.

Combien de temps dure un enregistrement ?

Il faudra environ 30 minutes pour effectuer l'enregistrement d'un thème de lecture : il faut signer quelques documents, poser le micro, ajuster la caméra puis procéder aux enregistrements des quatre sessions de lecture.

Est-ce que vous pouvez choisir le thème ?

Les premières personnes arrivées pourront choisir... Ensuite nous attribuerons le thème car nous avons besoin d'enregistrer au moins une personne pour chaque thème.

Que vont devenir les enregistrements ?

Essentiellement, ils seront analysés. Par exemple, ils nous permettront de déterminer la durée moyenne d'une clé, combien de temps il faut pour effectuer une transition entre deux clés, dans quelles zones du visage sont réalisées les voyelles, etc.

Avec votre accord, ils pourront être diffusés sur différents supports.

Consignes de lecture et codage des sessions


Lecture de syllabes :

Un diaporama va présenter successivement 32 syllabes, une syllabe par diapositive. Chaque syllabe ne forme qu'une seule clé (CV) que vous lirez en codant. Entre chaque syllabe, il y aura un petit temps d'arrêt afin que la main revienne à une position de "repos".

Autres lectures :

Un diaporama va présenter du texte que vous lirez en codant.

Quels sont les documents que vous devrez signer ?

Vous devrez d'abord remplir un formulaire concernant vos informations personnelles (nom, prénom, etc). Ce document restera confidentiel : il ne sera jamais diffusé ni partagé sans votre autorisation (voir le document).

A la fin de l'enregistrement, vous signerez un formulaire de consentement, qui nous autorise à utiliser les fichiers enregistrés (voir le document).

Droit à l'image et rétractation

Les enregistrements effectués lors de cette collecte sont soumises au droit à l'image. Les informations recueillies vous concernant feront l’objet de traitements décrits dans le formulaire de consentement. Les données recueilles seront hébergées ici par un site internet institutionnel d'archivage pérenne et sécurisé, sous le nom "CLeLfPC". La durée de conservation des données est de 50 ans.

Vous bénéficiez d’un droit d’accès, de rectification, de portabilité, d’effacement de celles-ci ou une limitation du traitement. Vous pouvez vous opposer au traitement des données vous concernant et disposez du droit de retirer votre consentement à tout moment en vous adressant à: brigitte.bigi[at]lpl-aix.fr.


Texte de réglages audio


Thème 1 : recette du gâteau chouette

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 2 : la chèvre de M. Seguin

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 3 : le cordonnier

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 4 : blagues

Syllabes :


Mots et expressions :


Phrases (expressions populaires) :


Texte :


Thème 5 : la bise et le soleil

Syllabes :


Mots et expressions :


Phrases (météo) :


Texte :


Thème 6 : la bague de maman

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 7 : les chats

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 8 : expressions populaires

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 9 : horoscope imaginaire

Syllabes :


Mots et expressions :


Phrases :


Texte :


Thème 10 : le jeu du Yams

Syllabes :


Mots et expressions :


Phrases :


Texte :