WorldCat Identities

Fohr, Dominique

Overview
Works: 10 works in 13 publications in 2 languages and 16 library holdings
Roles: Author, Opponent, Thesis advisor
Publication Timeline
.
Most widely held works by Dominique Fohr
Aphodex : Un système expert en décodage acoustico-phonétique de la parole continue by Dominique Fohr( Book )

4 editions published in 1986 in French and held by 4 WorldCat member libraries worldwide

Analyse et modélisation du savoir faire d'un expert en lecture de spectrogrammes, la compétence mise en jeu à ce niveau étant plus accessible a l'analyse car plus consciente. Après une première phase d'acquisition de l'expertise (règles et stratégies), une formalisation est proposée sous la forme d'un système expert à règles de production. Pour reproduire l'expertise, notre système est capable de : remettre en cause la segmentation à tout moment, dérouler en parallèle une analyse sur plusieurs segmentations possibles, prendre en compte les phénomènes contextuels, tenir compte de l'incertitude en ce qui concerne l'interprétation des mesures (détection d'indices), déterminer des seuils relatifs qui correspondents le mieux possible à la démarche experte. Les caractéristiques du système sont les suivantes : le moteur fonctionne en chaînage avant et en chaînage arrière ; le système est facilement incrémentable, avec interface conversationnelle pour entrer les règles ; les règles du système sont compréhensibles et modifiables facilement par l'expert ; le système fournit une trace de son raisonnement. Pour résoudre ces différents problèmes, nous avons développé notre propre moteur d'inférence, (sa principale caractéristique étant de pouvoir suivre plusieurs lignes de raisonnement en parallèle) et un certain nombre d'outils tels que : spectrogrammes numériques, algorithmes de traitement du signal, acquisition et segmentation d'un corpus, procédures de segmentation
The IFCASL Corpus of French and German Non-native and Native Read Speech by Jürgen Trouvain( )

1 edition published in 2017 in English and held by 2 WorldCat member libraries worldwide

Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step Process by Camille Fauth( )

1 edition published in 2017 in English and held by 2 WorldCat member libraries worldwide

Designing a bilingual speech corpus for French and German language learners by Jürgen Trouvain( )

1 edition published in 2017 in English and held by 2 WorldCat member libraries worldwide

Conribution de réseaux neuronaux pour la reconnaissance des occlusives au sein du système expert APHODEX by Dominique François( Book )

1 edition published in 1992 in French and held by 1 WorldCat member library worldwide

Séparation de la parole guidée par la localisation by Sunit Sivasankaran( )

1 edition published in 2020 in English and held by 1 WorldCat member library worldwide

Voice based personal assistants are part of our daily lives. Their performance suffers in the presence of signal distortions, such as noise, reverberation, and competing speakers. This thesis addresses the problem of extracting the signal of interest in such challenging conditions by first localizing the target speaker and using the location to extract the target speech. In a first stage, a common situation is considered when the target speaker utters a known word or sentence such as the wake-up word of a distant-microphone voice command system. A method that exploits this text information in order to improve the speaker localization performance in the presence of competing speakers is proposed. The proposed solution uses a speech recognition system to align the wake-up word to the corrupted speech signal. A model spectrum representing the aligned phones is used to compute an identifier which is then used by a deep neural network to localize the target speaker. Results on simulated data show that the proposed method reduces the localization error rate compared to the classical GCC-PHAT method. Similar improvements are observed on real data. Given the estimated location of the target speaker, speech separation is performed in three stages. In the first stage, a simple delay-and-sum (DS) beamformer is used to enhance the signal impinging from that location which is then used in the second stage to estimate a time-frequency mask corresponding to the localized speaker using a neural network. This mask is used to compute the second-order statistics and to derive an adaptive beamformer in the third stage. A multichannel, multispeaker, reverberated, noisy dataset -- inspired from the famous WSJ0-2mix dataset -- was generated and the performance of the proposed pipeline was investigated in terms of the word error rate (WER). To make the system robust to localization errors, a Speaker LOcalization Guided Deflation (SLOGD) based approach which estimates the sources iteratively is proposed. At each iteration the location of one speaker is estimated and used to estimate a mask corresponding to that speaker. The estimated source is removed from the mixture before estimating the location and mask of the next source. The proposed method is shown to outperform Conv-TasNet. Finally, we consider the problem of explaining the robustness of neural networks used to compute time-frequency masks to mismatched noise conditions. We employ the so-called SHAP method to quantify the contribution of every time-frequency bin in the input signal to the estimated time-frequency mask. We define a metric that summarizes the SHAP values and show that it correlates with the WER achieved on separated speech. To the best of our knowledge, this is the first known study on neural network explainability in the context of speech separation
Exploitation du contexte sémantique pour améliorer la reconnaissance des noms propres dans les documents audio diachroniques by Imran Sheikh( )

1 edition published in 2016 in English and held by 1 WorldCat member library worldwide

La nature diachronique des bulletins d'information provoque de fortes variations du contenu linguistique et du vocabulaire dans ces documents. Dans le cadre de la reconnaissance automatique de la parole, cela conduit au problème de mots hors vocabulaire (Out-Of-Vocabulary, OOV). La plupart des mots OOV sont des noms propres. Les noms propres sont très importants pour l'indexation automatique de contenus audio-vidéo. De plus, leur bonne identification est importante pour des transcriptions automatiques fiables. Le but de cette thèse est de proposer des méthodes pour récupérer les noms propres manquants dans un système de reconnaissance. Nous proposons de modéliser le contexte sémantique et d'utiliser des informations thématiques contenus dans les documents audio à transcrire. Des modèles probabilistes de thème et des projections dans un espace continu obtenues à l'aide de réseaux de neurones sont explorés pour la tâche de récupération des noms propres pertinents. Une évaluation approfondie de ces représentations contextuelles a été réalisée. Pour modéliser le contexte de nouveaux mots plus efficacement, nous proposons des réseaux de neurones qui maximisent la récupération des noms propres pertinents. En s'appuyant sur ce modèle, nous proposons un nouveau modèle (Neural Bag-of-Weighted-Words, NBOW2) qui permet d'estimer un degré d'importance pour chacun des mots du document et a la capacité de capturer des mots spécifiques à ce document. Des expériences de reconnaissance automatique de bulletins d'information télévisés montrent l'efficacité du modèle proposé. L'évaluation de NBOW2 sur d'autres tâches telles que la classification de textes montre des bonnes performances
Selectively trained neural networks for the discrrimination of normal and lombard speech by Yolande Anglade( Book )

1 edition published in 1992 in English and held by 1 WorldCat member library worldwide

A robust discrimination method based on selectively trained neural networks by Yolande Anglade( Book )

1 edition published in 1992 in English and held by 1 WorldCat member library worldwide

Reconnaissance de vocabulaires difficiles à l'aide de réseaux neuronaux by Yolande Anglade( Book )

1 edition published in 1992 in French and held by 1 WorldCat member library worldwide

 
Audience Level
0
Audience Level
1
  Kids General Special  
Audience level: 0.95 (from 0.94 for Aphodex : ... to 0.97 for Conributio ...)

Languages