Dans le cadre du travail mené avec l’action de recherche Humanités Numériques Spatialisées soutenu par le GdR CNRS MAGIS, nous proposons un atelier associé à la conférence TALN | RECITAL 2022 sur le thème du TAL et des Humanités Numériques.
Présentation de l’atelier
Cette première édition de l’atelier TAL&HN aura lieu le 27 juin 2022 sur le campus Hannah Arendt d’Avignon Université (74 rue Louis Pasteur, 84029 Avignon). Cet atelier fait suite à une série d’évènements organisés par notre action de recherche tel que l’atelier Humanités Numériques Spatialisés associé à la conférence SAGEO 2021 et la série d’ateliers Geospatial Humanities associés à la conférence internationale ACM SIGSPATIAL.
Les actes de l’atelier sont disponibles en ligne dans les archives de l’ATALA et sur HAL : http://talnarchives.atala.org/ateliers/2022/TALHN/index.html
Programme
9H00 - 9H15 – Introduction - Slides
9H20 - 10H30 – Session : étude du genre
Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS
Marco Naguib, Marine Delaborde, Blandine Andrault, Anaïs Bekolo et Olga Seminck
Slides
Exploration orientée entités : étude du genre dans le Mercure de France
Yoann Dupont et Marguerite Bordry
Slides
Flux d’informations dans les systèmes encodeur-décodeur. Application à l’explication des biais de genre dans les systèmes de traduction automatique
Lichao Zhu, Guillaume Wisniewski, Nicolas Ballier et François Yvon
Slides
10H-30 - 11H – Pause café
11H00 - 12H10 – Session : Reconnaissance automatique et erreurs OCR
Reconnaissance d’entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique
Caroline Koudoro-Parfait, Gaël Lejeune et Richy Buth
Slides
Simulation d’erreurs d’OCR dans les systèmes de TAL pour le traitement de données anachroniques
Baptiste Blouin, Benoit Favre et Jeremy Auguste
Slides
Reconnaisance automatique des appellations d’œuvres visuelles antiques
Aurore Lessieux, Iris Eshkol-Taravella, Anne-Violaine Szabados et Marlène Nazarian
Slides
12H-30 - 14H00 – Déjeuner
14H00 - 15H30 – Session : Corpus, TEI, et analyse de discours
LDAPOL: vers une méthodologie de contextualisation des discours politiques
Jeanne Vermeirsche, Eric Sanjuan et Tania Jiménez
Slides
La Chine de Buffon : édition numérique et exploration sémantique de l’Histoire naturelle (1749-1789)
Axel Le Roy, Motasem Alrahabi et Glenn Roe
Réinterroger l’édition numérique et la consultation d’oeuvres anciennes : traçabilité, accessibilité, interprétabilité.
Emmanuel Giguet et Julia Roger
Slides
TAL et littérature comparée. Détection automatique des correspondances textuelles entre les réécritures d’un mythe.
Karolina Suchecka et Nathalie Gasiglia
Slides
Organisation et comité de programme
Ludovic Moncla (LIRIS, INSA Lyon)
Carmen Brando (CRH, EHESS)