[New Publication] From text to data: mediality in corpus-based translation studies (Open access)

By Jan Buts and Henry Jones


This paper seeks to promote deeper reflection within the field of corpus-based translation studies (CTS) regarding the digital tools by means of which research in this discipline proceeds. It explicates a range of possibilities and constraints brought to the analysis of translated texts by the keyword in context (KWIC) concordancer and other data visualisation applications, paying particular attention to the ways in which these technological affordances have actively shaped central theoretical hypotheses within CTS and related fields, as well as the general principles of corpus construction. This discussion is illustrated through a small case study which applies the suite of corpus analysis tools developed as part of the Genealogies of Knowledge project to the investigation of two English translations of the Communist Manifesto.

| Cet article cherche à stimuler une réflexion plus approfondie dans la traductologie de corpus concernant les outils numériques au moyen desquels la recherche est menée dans cette discipline. L’article explique diverses possibilités et contraintes de l’analyse des textes traduits, assistée par un concordancier « KeyWord In Context » (KWIC) et par d’autres outils de visualisation des données. Une attention particulière sera portée à la manière dont ces affordances technologiques ont façonné des hypothèses théoriques centrales ainsi que les grands principes de la construction de corpus, dans l’approche traductologique basée sur le corpus et dans d’autres domaines proches. Cette discussion est illustrée par une étude de cas appliquant la suite logicielle développée pour l’analyse de corpus dans le cadre du projet Genealogies of Knowledge, à deux traductions en anglais du Manifeste communiste.