Dans le cadre du travail mené avec l’action de recherche Humanités Numériques Spatialisées soutenu par le GdR CNRS MAGIS, nous proposons un atelier associé à la conférence TALN | RECITAL 2022 sur le thème du TAL et des Humanités Numériques.

Présentation de l’atelier

Cette première édition de l’atelier TAL&HN aura lieu le 27 juin 2022 sur le campus Hannah Arendt d’Avignon Université (74 rue Louis Pasteur, 84029 Avignon). Cet atelier fait suite à une série d’évènements organisés par notre action de recherche tel que l’atelier Humanités Numériques Spatialisés associé à la conférence SAGEO 2021 et la série d’ateliers Geospatial Humanities associés à la conférence internationale ACM SIGSPATIAL.

Les actes de l’atelier sont disponibles en ligne dans les archives de l’ATALA et sur HAL : http://talnarchives.atala.org/ateliers/2022/TALHN/index.html

image

Programme

9H00 - 9H15 – Introduction - Slides
9H20 - 10H30 – Session : étude du genre

Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS
Marco Naguib, Marine Delaborde, Blandine Andrault, Anaïs Bekolo et Olga Seminck
Slides

Exploration orientée entités : étude du genre dans le Mercure de France
Yoann Dupont et Marguerite Bordry
Slides

Flux d’informations dans les systèmes encodeur-décodeur. Application à l’explication des biais de genre dans les systèmes de traduction automatique
Lichao Zhu, Guillaume Wisniewski, Nicolas Ballier et François Yvon
Slides

10H-30 - 11H – Pause café

11H00 - 12H10 – Session : Reconnaissance automatique et erreurs OCR

Reconnaissance d’entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique
Caroline Koudoro-Parfait, Gaël Lejeune et Richy Buth
Slides

Simulation d’erreurs d’OCR dans les systèmes de TAL pour le traitement de données anachroniques
Baptiste Blouin, Benoit Favre et Jeremy Auguste
Slides

Reconnaisance automatique des appellations d’œuvres visuelles antiques
Aurore Lessieux, Iris Eshkol-Taravella, Anne-Violaine Szabados et Marlène Nazarian
Slides

12H-30 - 14H00 – Déjeuner

14H00 - 15H30 – Session : Corpus, TEI, et analyse de discours

LDAPOL: vers une méthodologie de contextualisation des discours politiques
Jeanne Vermeirsche, Eric Sanjuan et Tania Jiménez
Slides

La Chine de Buffon : édition numérique et exploration sémantique de l’Histoire naturelle (1749-1789)
Axel Le Roy, Motasem Alrahabi et Glenn Roe

Réinterroger l’édition numérique et la consultation d’oeuvres anciennes : traçabilité, accessibilité, interprétabilité.
Emmanuel Giguet et Julia Roger
Slides

TAL et littérature comparée. Détection automatique des correspondances textuelles entre les réécritures d’un mythe.
Karolina Suchecka et Nathalie Gasiglia
Slides

Organisation et comité de programme

Ludovic Moncla (LIRIS, INSA Lyon)
Carmen Brando (CRH, EHESS)