Lucía Ormaechea Grijalba

Chi Sono.

Dottoranda, Linguista informatica & Ricercatrice in NLP

Benvenuti sul mio sito web 👋 Mi chiamo Lucía, Sono ricercatrice in NLP e dottoranda in Trattamento Informatico Multilingue presso l'Università di Ginevra (FTI/TIM) e il Laboratorio di Informatica di Grenoble (LIG/GETALP), nell'ambito del progetto ANR/FNS PROPICTO.

Ho ottenuto una laurea in Filologia Ispanica presso l'Università di Navarra (Pamplona, Spagna) e una laurea magistrale in Trattamento Automatico del Linguaggio presso l'Institut National des Langues et Civilisations Orientales (Parigi, Francia). Le mie ricerche si concentrano sulla semplificazione automatica del parlato in condizioni di scarse risorse.

Non esitate a contattarmi per ulteriori informazioni 😀



Dati Personali

  • NomeLucía
  • CognomeOrmaechea Grijalba
  • DaPamplona, Spagna
  • ResidenzaGinevra, Svizzera

Ambiti di ricerca

Riconoscimento vocale

Semplificazione dei testi

Sistemi multimodali

Carriera.

Studi

  • Dottorato, Trattamento Informatica Multilingue (Borsa Candoc FNS)

    Università di Ginevra & Università Grenoble-Alpes | Ginevra, Svizzera

    Attualmente sto preparando una tesi in cotutela tra il Dipartimento di Trattamento Informatico Multilingue dell'Università di Ginevra, e il gruppo di ricerca GETALP, affiliato all'Università Grenoble-Alpes.

    La mia ricerca fa parte del progetto PROPICTO, il cui obiettivo è quello di creare sistemi di traduzione da parola a pittogrammi.


    Titolo del progetto di tesi: Exploring Automatic Spoken Language Simplification in Low-Resource Conditions.

    Attualmente 06.2022
  • Laurea magistrale in Trattamento Automatico del Linguaggio

    Inalco & Università Sorbonne-Nouvelle & Università Paris Nanterre | Parigi, Francia

    Laureata con lode.


    Corsi frequentati: Linguaggi di script (Python, Bash, Perl) – Programmazione orientata agli oggetti (C+, Java) – Metodi statistici per l'analisi di corpus – Reti neurali convoluzionali – Text mining – Linguistica di corpus – Linguaggi di mark-up (XML, XSLT) – Basi di dati (SQL, Neo4J).

    Tesi di laurea magistrale: "Mise en place d'un système robuste de reconnaissance automatique de la parole appliqué au domaine médical". Voto: 19/20.

    09.2020 09.2018
  • Laurea in Filologia Ispanica

    Università di Navarra | Pamplona, Spagna

    Candidata al Premio Straordinario di Laurea.


    Corsi frequentati: Fonologia e fonetica – Lessicologia e semantica – Sociolinguistica e variazione geolinguistica – Analisi del discorso – Morfologia e sintassi.

    06.2018 09.2014

Esperienze Lavorative

  • Assistente di ricerca e insegnamento

    Università di Ginevra | Ginevra, Svizzera

    Partecipazione al progetto BabelDr:
    • Sviluppo di un sistema specializzato di Riconoscimento Automatico della Parola (RAP).
    • Implementazione di un'applicazione Docker per eseguire il RAP nel sistema di traduzione medica BabelDr.

    Partecipazione al progetto PROPICTO:
    • Pubblicazione di numerosi articoli relativi alla semplificazione automatica del linguaggio parlato.
    • Sviluppo e manutenzione del sito web del progetto.


    Lavoro come assistente nel contesto di Localizzazione (corso magistrale): preparazione dei materiali didattici – correzione dei laboratori pratici – supporto agli studenti durante le sessioni pratiche.

    Attualmente 12.2020
  • Tirocinio in ingegneria linguistica

    Lab. di Informatica di Grenoble | Grenoble, Francia

    Partecipazione al progetto BabelDr: sviluppo di un sistema di riconoscimento automatico della parola per il settore medico.


    Compiti principale:
    • Progettazione di una pipeline completa per introdurre modelli di linguaggio basati su grammatiche nel toolbox Kaldi.
    • Creazione di contenitori Docker per il riconoscimento vocale.
    • Addestramento di modelli acustici HMM-DNN basati su corpus open source.
    • Sviluppo di un'API web per Kaldi.
    • Regolazione e valutazione dei prototipi progettati.

    09.2020 02.2020
  • Tirocinio in traduzione

    New York Habitat | Lavoro da remoto

    Traduzione ENG > ESP di testi commerciali: Trascrizioni di video – Racconti di viaggio – Recensioni dei clienti – Raccomandazioni dei clienti.

    09.2018 07.2018
  • Assistente di ricerca

    Università di Navarra | Pamplona, Spagna

    Partecipazione come studentessa ricercatrice all'interno del Dipartimento di Filologia.

    Compiti principale:
    • Creazione di materiali didattici per valutare automaticamente il livello di conoscenza della lingua spagnola negli apprendenti non nativi.
    • Seminari sulla scrittura accademica per studenti allofoni.
    • Corsi destinati a parlanti non nativi di spagnolo.
    • Revisione e correzione di articoli scientifici, classificazione dei documenti.

    06.2017 09.2016

Lingue

Spagnolo

100%

Inglese

95%

Francese

95%

Italiano

50%

Competenze

Programmazione

  • Python
  • Bash
  • Perl
  • C++
  • Java
  • SQL

Librerie

  • OpenFST
  • Keras
  • Pandas
  • NLTK
  • SpaCy

Sviluppo Web

  • HTML
  • CSS
  • Jekyll
  • Flask
  • XML
  • XSLT

Strumenti

  • Kaldi
  • Git
  • LaTeX
  • Docker
  • Praat
  • SRILM

Pubblicazioni.



Articoli di Riviste

Automatic Text Simplification for French: Model Fine-Tuning for Simplicity Assessment and Simpler Text Generation

Lucía Ormaechea e Nikos Tsourakis.
In: International Journal of Speech Technology, Springer, vol. 27.
Dicembre 2024



Articoli di Conferenze

TIM-UNIGE Translation into Low-Resource Languages of Spain for WMT24

Jonathan Mutal e Lucía Ormaechea.
In: Proceedings of the Ninth Conference on Machine Translation (WMT), Miami (Stati Uniti).
Novembre 2024



Simplification Strategies in French Spontaneous Speech

Lucía Ormaechea, Nikos Tsourakis, Didier Schwab, Pierrette Bouillon e Benjamin Lecouteux.
In: Proceedings of the Workshop on DeTermIt! Evaluating Text Difficulty in a Multilingual Context, LREC-COLING 2024, Torino (Italia).
Maggio 2024



Simple, Simpler and Beyond: A Fine-Tuning BERT-Based Approach to Enhance Sentence Complexity Assessment for Text Simplification

Lucía Ormaechea, Nikos Tsourakis, Didier Schwab, Pierrette Bouillon e Benjamin Lecouteux.
In: Proceedings of the 6th International Conference on Natural Language and Speech Processing (ICNSLP), Trento (Italia).
Dicembre 2023



Extracting Sentence Simplification Pairs from French Comparable Corpora Using a Two-Step Filtering Method

Lucía Ormaechea e Nikos Tsourakis.
In: Proceedings of the 8th Swiss Text Analytics Conference 2023 (SwissText), Neuchâtel (Svizzera).
Giugno 2023



PROPICTO: Developing Speech-to-Pictograph Translation Systems to Enhance Communication Accessibility

Lucía Ormaechea, Pierrette Bouillon, Maximin Coavoux, Emmanuelle Esperança-Rodier, Johanna Gerlach, Jerôme Goulian, Benjamin Lecouteux, Cécile Macaire, Jonathan Mutal, Magali Norré, Adrien Pupier e Didier Schwab.
In: Proceedings of the 24th Annual Conference of The European Association for Machine Translation (EAMT), Tampere (Finlandia).
Giugno 2023



Une chaîne de traitements pour la simplification automatique de la parole et sa traduction automatique vers des pictogrammes

Cécile Macaire, Lucía Ormaechea Grijalba e Adrien Pupier.
In: 29ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Avignon (Francia).
Giugno 2022



Presentazioni

Vers une simplification automatique de la parole en français : Les enjeux de l’extraction des données d’apprentissage pour la simplification linguistique

Lucía Ormaechea, Pierrette Bouillon, Benjamin Lecouteux e Didier Schwab.
In: Colloque de l'Association for French Language Studies (AFLS) — Le français et ses frontières, Lille (Francia).
Settembre 2023



PROPICTO : Développer des systèmes de traduction de la parole vers des séquences de pictogrammes pour améliorer l'accessibilité de la communication

Lucía Ormaechea, Pierrette Bouillon, Maximin Coavoux, Emmanuelle Esperança-Rodier, Johanna Gerlach, Jerôme Goulian, Benjamin Lecouteux, Cécile Macaire, Jonathan Mutal, Magali Norré, Adrien Pupier, Didier Schwab e Hervé Spechbach.
In: 30ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Parigi (Francia).
Giugno 2023



A Tool for Easily Integrating Grammars as Language Models into the Kaldi Speech Recognition Toolkit

Lucía Ormaechea Grijalba, Benjamin Lecouteux, Pierrette Bouillon e Didier Schwab.
In: Bridges and Gaps between Formal and Computational Linguistics (ESSLLI 2022 workshop), Galway (Irlanda).
Agosto 2022



Reconnaissance vocale du discours spontané pour le domaine médical

Lucía Ormaechea Grijalba, Pierrette Bouillon, Johanna Gerlach, Benjamin Lecouteux, Didier Schwab e Hervé Spechbach.
In: Journée Commune AFIA/TLH: Technologies du Langage Humain et Santé (online).
Febbraio 2021



Poster

From Complex to Simpler Transcriptions: Simplifying Spontaneous French Speech

Lucía Ormaechea e Nikos Tsourakis
In: Journée d'échanges sur la recherche à la FTI, Ginevra (Svizzera).
Settembre 2024



Integrating Grammar-Based Language Models into Domain-Specific Speech Recognition Systems

Lucía Ormaechea Grijalba
In: Second Advanced Language Processing School (ALPS), organizzato dall'Università di Grenoble-Alpes e da Naver Labs Europe (online).
Gennaio 2022



Tesi di Laurea Magistrale

Mise en place d'un système robuste de reconnaissance automatique de la parole appliqué au domaine médical

Lucía Ormaechea Grijalba
Settembre 2020


Terminale.