Lucía Ormaechea Grijalba

Sobre mí.

Doctoranda, Lingüista Computacional & Investigadora en NLP

Bienvenido a mi sitio web 👋 Me llamo Lucía, soy investigadora en NLP y estudiante de doctorado en Tratamiento Informático Multilingüe en la Universidad de Ginebra (FTI/TIM) y el Laboratorio de Informática de Grenoble (LIG/GETALP), dentro del proyecto ANR/FNS PROPICTO.

Me gradué en Filología Hispánica por la Universidad de Navarra (Pamplona, España) y obtuve un máster en Procesamiento del Lenguaje Natural en el Institut National des Langues et Civilisations Orientales (París, Francia). Con mi investigación, pretendo explorar la simplificación automática del habla, con un especial énfasis en contextos de bajos recursos.

Para más información, no dude en ponerse en contacto conmigo 😀



Información Personal

  • NombreLucía
  • ApellidosOrmaechea Grijalba
  • OrigenPamplona, España
  • ResidenciaGinebra, Suiza

Áreas de investigación

Reconocimiento del habla

Simplificación textual

Sistemas multimodales

Trayectoria.

Estudios

  • Doctorado, Tratamiento Informático Multilingüe (Beca Candoc FNS)

    Universidad de Ginebra & Universidad Grenoble-Alpes | Ginebra, Suiza

    Actualmente realizo un doctorado en cotutela entre el Departamento de Tratamiento Informático Multilingüe en la Universidad de Ginebra, y el equipo de investigación GETALP, adscrito a la Universidad Grenoble-Alpes.

    Mi trabajo se desarrolla dentro de PROPICTO, un proyecto de investigación cuyo objetivo es crear sistemas de traducción habla-pictogramas.


    Título del proyecto de doctorado: Exploring Automatic Spoken Language Simplification in Low-Resource Conditions.

    Presente 06.2022
  • Máster en Procesamiento del Lenguaje Natural

    Inalco & Universidad Sorbonne-Nouvelle & Universidad Paris Nanterre | París, Francia

    Graduada con altos honores.


    Clases cursadas: lenguajes de programación (Python, Bash, Perl) – programación orientada a objetos (C++, Java) – minería de textos – métodos estadísticos para la explotación de corpus – redes neuronales convolucionales para la identificación de lenguas – lingüística de corpus – lenguajes de marcado (XML, XSLT) – bases de datos (SQL, Neo4J).

    Trabajo de fin de máster: "Mise en place d'un système robuste de reconnaissance automatique de la parole appliqué au domaine médical". Nota final: 19/20.

    09.2020 09.2018
  • Grado en Filología Hispánica

    Universidad de Navarra | Pamplona, España

    Candidata al Premio Extraordinario de Fin de Grado.


    Clases cursadas: fonética y fonología – lexicología y semántica – sociolingüística y variación dialectal – análisis del discurso – morfología y sintaxis.

    06.2018 09.2014

Experiencia

  • Ayudante de investigación y enseñanza

    Universidad de Ginebra | Ginebra, Suiza

    Colaboración en BabelDr:
    • Desarrollo de un sistema especializado de Reconocimiento Automático del Habla (RAH).
    • Puesta en marcha de una aplicación Docker para reconocimiento vocal dentro de la herramienta de traducción médica BabelDr.

    Participación en PROPICTO:
    • Compilación de pares de oraciones complejas-simples a partir de corpus comparables.
    • Desarrollo del front-end y mantenimiento del sitio web del proyecto.


    Colaboración como ayudante en Localización (clase de máster): preparación de contenidos – evaluación y calificación de los trabajos semanales – asistencia a los estudiantes durante las sesiones prácticas.

    Presente 12.2020
  • Ingeniera lingüista en prácticas

    Lab. de Informática de Grenoble | Grenoble, Francia

    Participación en el proyecto BabelDr: desarrollo de un sistema de reconocimiento automático del habla aplicado al ámbito médico.


    Tareas principales:
    • Concepción de un proceso completo para inyectar modelos de lengua basados en gramáticas en el software de reconocimiento de voz Kaldi.
    • Creación de contenedores Docker para aplicaciones de reconocimiento vocal.
    • Entrenamiento de modelos acústicos HMM-DNN basados en corpus open-source.
    • Desarrollo de una web API para Kaldi.
    • Ajuste y evaluación de los prototipos diseñados.

    09.2020 02.2020
  • Traductora en prácticas

    New York Habitat | Trabajo remoto

    Traducción ENG > ESP de textos comerciales: transcripciones de vídeos – artículos de viajes – críticas de apartamentos – recomendaciones de clientes.

    09.2018 07.2018
  • Alumna interna investigadora

    Universidad de Navarra | Pamplona, España

    Colaboré como alumna interna en el Departamento de Filología.

    Tareas principales:
    • Creación de materiales para el aprendizaje destinados a evaluar automáticamente el conocimiento de español en estudiantes extranjeros.
    • Tutorías personalizadas centradas en la escritura académica.
    • Impartición de talleres dirigidos a hablantes no nativos de español.
    • Revisión de artículos científicos, clasificación de documentos.

    06.2017 09.2016

Lenguas

Español

100%

Inglés

95%

Francés

95%

Italiano

33%

Habilidades

Programación

  • Python
  • Bash
  • Perl
  • C++
  • Java
  • SQL

Librerías

  • OpenFST
  • Keras
  • Pandas
  • NLTK
  • SpaCy

Desarrollo Web

  • HTML
  • CSS
  • Jekyll
  • Flask
  • XML
  • XSLT

Herramientas

  • Kaldi
  • Git
  • LaTeX
  • Docker
  • Praat
  • SRILM

Publicaciones.



Artículos de Conferencias

TIM-UNIGE Translation into Low-Resource Languages of Spain for WMT24

Jonathan Mutal y Lucía Ormaechea.
In: Proceedings of the Ninth Conference on Machine Translation (WMT), Miami (EE.UU.).
Noviembre 2024



Simplification Strategies in French Spontaneous Speech

Lucía Ormaechea, Nikos Tsourakis, Didier Schwab, Pierrette Bouillon y Benjamin Lecouteux.
In: Proceedings of the Workshop on DeTermIt! Evaluating Text Difficulty in a Multilingual Context, LREC-COLING 2024, Turín (Italia).
Mayo 2024



Simple, Simpler and Beyond: A Fine-Tuning BERT-Based Approach to Enhance Sentence Complexity Assessment for Text Simplification

Lucía Ormaechea, Nikos Tsourakis, Didier Schwab, Pierrette Bouillon y Benjamin Lecouteux.
In: Proceedings of the 6th International Conference on Natural Language and Speech Processing (ICNSLP), Trento (Italia).
Diciembre 2023



Extracting Sentence Simplification Pairs from French Comparable Corpora Using a Two-Step Filtering Method

Lucía Ormaechea y Nikos Tsourakis.
In: Proceedings of the 8th Swiss Text Analytics Conference 2023 (SwissText), Neuchâtel (Suiza).
Junio 2023



PROPICTO: Developing Speech-to-Pictograph Translation Systems to Enhance Communication Accessibility

Lucía Ormaechea, Pierrette Bouillon, Maximin Coavoux, Emmanuelle Esperança-Rodier, Johanna Gerlach, Jerôme Goulian, Benjamin Lecouteux, Cécile Macaire, Jonathan Mutal, Magali Norré, Adrien Pupier y Didier Schwab.
In: Proceedings of the 24th Annual Conference of The European Association for Machine Translation (EAMT), Tampere (Finlandia).
Junio 2023



Une chaîne de traitements pour la simplification automatique de la parole et sa traduction automatique vers des pictogrammes

Cécile Macaire, Lucía Ormaechea Grijalba y Adrien Pupier.
In: 29ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Aviñón (Francia).
Junio 2022



Presentaciones

Vers une simplification automatique de la parole en français : Les enjeux de l’extraction des données d’apprentissage pour la simplification linguistique

Lucía Ormaechea, Pierrette Bouillon, Benjamin Lecouteux y Didier Schwab.
In: Colloque de l'Association for French Language Studies (AFLS) — Le français et ses frontières, Lila (Francia).
Septiembre 2023



PROPICTO : Développer des systèmes de traduction de la parole vers des séquences de pictogrammes pour améliorer l'accessibilité de la communication

Lucía Ormaechea, Pierrette Bouillon, Maximin Coavoux, Emmanuelle Esperança-Rodier, Johanna Gerlach, Jerôme Goulian, Benjamin Lecouteux, Cécile Macaire, Jonathan Mutal, Magali Norré, Adrien Pupier, Didier Schwab y Hervé Spechbach.
In: 30ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), París (Francia).
June 2023



A Tool for Easily Integrating Grammars as Language Models into the Kaldi Speech Recognition Toolkit

Lucía Ormaechea Grijalba, Benjamin Lecouteux, Pierrette Bouillon y Didier Schwab.
In: Bridges and Gaps between Formal and Computational Linguistics (ESSLLI 2022 workshop), Galway (Irlanda).
Agosto 2022



Reconnaissance vocale du discours spontané pour le domaine médical

Lucía Ormaechea Grijalba, Pierrette Bouillon, Johanna Gerlach, Benjamin Lecouteux, Didier Schwab y Hervé Spechbach.
In: Journée Commune AFIA/TLH: Technologies du Langage Humain et Santé (a distancia).
Febrero 2021



Pósteres

From Complex to Simpler Transcriptions: Simplifying Spontaneous French Speech

Lucía Ormaechea y Nikolaos Tsourakis
In: Journée d'échanges sur la recherche à la FTI, Ginebra (Suiza).
Septiembre 2024



Integrating Grammar-Based Language Models into Domain-Specific Speech Recognition Systems

Lucía Ormaechea Grijalba
In: Second Advanced Language Processing School (ALPS), organizada por Univ. Grenoble-Alpes y Naver Labs Europe (a distancia).
Enero 2022



Trabajo de Fin de Máster

Mise en place d'un système robuste de reconnaissance automatique de la parole appliqué au domaine médical

Lucía Ormaechea Grijalba
Septiembre 2020


Terminal.