1215 - 1234 El texto digital y la disyuntiva.indd 1215Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 El texto digital y la disyuntiva de las humanidades digitales Ernesto Priani1 Recibido: 2015-08-29 Aprobado por pares: 2015-09-29 Enviado a pares: 2015-08-29 Aceptado: 2015-10-01 DOI: 10.5294/pacla.2015.18.4.11 Para citar este artículo / To reference this article / Para citar este artigo Priani, E. (Diciembre de 2015) El texto digital y la disyuntiva de las humanidades digitales. Palabra Clave, 18(4), 1215-1234. DOI: 10.5294/pacla.2015.18.4.11 Resumen A partir del hecho de que las humanidades se estudian dentro de una eco- logía mixta entre lo impreso y lo digital, y en donde este último está ten- diendo a ser predominante, el artículo se pregunta qué tanto el cambio de ámbito conduce a las humanidades hacia el umbral de un nuevo paradigma, o si los conceptos, métodos e ideas que han constituido tradicionalmente a las humanidades continúan vigentes aún en este nuevo entorno. Para res- ponder a esta pregunta, el artículo se propone abordar el tema del texto y sus posibles variaciones prácticas y teóricas a partir de su digitalización. El texto ocupa un lugar predominante dentro de las humanidades porque es, al mismo tiempo, objeto primario de estudio, producción de conocimien- to y diseminación. El artículo sostiene que aun cuando la digitalización nos obliga a redefinir nuestra noción de ‘texto’ porque se ha modificado su na- turaleza y se ha abierto una intensa discusión sobre lo que este es, no se ha roto ni teórica ni prácticamente con el paradigma de lo impreso. Las teo- rías sobre el texto digital desarrolladas por Dino Buzzetti, Manfred Thaller, Jerom McGann y Paul Caton, así como la concepción misma de la codifi- cación SGML/XML/TEI, que serán objeto de análisis de este artículo, pre- servan residuos de la concepción tradicional sobre el texto, que evidencian 1 Universidad Nacional Autónoma de México, México. epriani@gmail.com 1216 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani cuán poco las humanidades se han desprendido de nociones provenientes de la tecnología de lo impreso. Palabras clave Texto, humanidades digitales, digitalización, ecología de medios (Fuente: Tesauro de la Unesco). The Digital Text and the Choice of Digital Humanities Abstract A part from the fact that the humanities are studied within a mixed ecology between print and digital, and where the latter is tending to prevail, the ar- ticle questions how much the change of scope leads the humanities to the threshold of a new paradigm, or whether the concepts, methods and ideas that have traditionally been the humanities are still valid even in this new environment. To answer this question, the article attempts to address the topic of the text and its possible practical and theoretical variations from digitization. The text plays a major role within the humanities because it is at the same time, the primary object of study, knowledge production and dissemination. The article argues that although digitalization requires us to redefine our notion of ‘text’ because it has changed its nature and has ope- ned an intense discussion about what this is, is not broken either theoreti- cally or practically with the paradigm of what is printed. Theories of digital text developed by Dino Buzzetti, Manfred Thaller, Jerom McGann and Paul Caton as well as the very concept of coding SGML / XML / TEI, which will be analyzed in this article, preserve residues on the traditional concept of the text, which show how little the humanities have become detached from notions of print technology. Keywords Text, digital humanities, digitization, media ecology (Source: Unesco Thesaurus). 1217Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 O texto digital e a disjuntiva das humanidades digitais Resumo A partir do fato de que as humanidades são estudadas dentro de uma ecologia híbrida entre o impresso e o digital, na qual este último tende a predominar, este artigo se questiona sobre o quanto a mudança de âmbito conduz as humanidades ao limiar de um novo paradigma, ou se os conceitos, métodos e ideias que constituíram tradicionalmente as humanidades continuam válidas ainda nesse novo ambiente. Para responder a essa pergunta, o artigo se propõe abordar o tema do texto e suas possíveis variações práticas e teóricas a partir da digitalização. O texto ocupa um lugar predominante dentro das humanidades porque é, ao mesmo tempo, objeto primário de estudo, produção do conhecimento e disseminação. Além disso, sustenta que, ainda quando a digitalização nos obriga a redefinir nossa noção de texto, porque sua natureza foi modificada e aberta uma intensa discussão sobre o que este é, não se rompeu, nem teórica nem praticamente, com o paradigma do impresso. As teorias sobre o texto digital desenvolvidas por Dino Buzzetti, Manfred Thaller, Jerom McGann e Paul Caton, bem como a concepção da codificação SGML/XML/TEI, que serão objeto de análise deste artigo, preservam resíduos da concepção tradicional sobre o texto, o que evidencia que as humanidades têm se desprendido pouco das noções provenientes da tecnologia do impresso. Palavras-chave Texto, humanidades digitais, digitalização, ecologia das mídias (Fonte: Te- sauro da Unesco). 1218 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani El presente artículo parte de la premisa de que las humanidades experimen- tan una transformación, producto de una alteración del entorno tecnológi- co dentro del cual tienen lugar. Si bien es cierto que el proceso está en curso y las humanidades se estudian todavía en una ecología mixta entre lo im- preso y lo digital (Eggert, 2005), en la medida en que esta última va con- virtiéndose en el ámbito predominante para la producción, el estudio y la diseminación de las humanidades, cabe la pregunta de qué tanto el cambio de ámbito conduce a las humanidades hacia el umbral de un nuevo paradig- ma, o si los conceptos, métodos e ideas que han constituido tradicionalmen- te a las humanidades continúan vigentes aún en este nuevo entorno. Para responder así sea parcialmente a esta pregunta, me he propuesto abordar el tema del texto y sus posibles variaciones prácticas y teóricas a partir de su digitalización. Texto es, sin lugar a dudas, uno de los conceptos más tras- cendentes para el conjunto de las humanidades que, al menos en principio, cambia de sentido con la nueva ecología digital. De hecho, la cuestión de la textualidad es uno de los problemas en que se ha centrado el debate dentro de las llamadas humanidades digitales (Eggert, 2005, Caton, 2013, Buzzet- ti y Thaller, 2012), ese espacio de aplicación y reflexión académica sobre el uso de métodos y sistemas computacionales en las humanidades. La razón resulta obvia: el texto ocupa un lugar predominante dentro de las humani- dades porque es, al mismo tiempo, objeto primario de estudio, producción de conocimiento y diseminación. Su digitalización parece modificar radi- calmente la concepción del texto porque introduce diferencias importan- tes en su producción, manipulación y conservación (Hillesund, 2005), y en esa medida abre nuevas opciones para su estudio y producción dentro de las humanidades. Pero ¿qué tanto la digitalización del texto ha signifi- cado una modificación de su concepción clásica, como un ideal que pre- cede a cualquiera de sus formas, habiendo sido concebido únicamente por el autor (Cerquiglini, 1998)? ¿Qué tanto significa una renovación de me- dios y métodos de estudio? En suma, ¿qué tan lejos realmente estamos del texto “autónomo y cerrado”, como lo definieran Todorov y Ducroct y de las formas de su análisis (Culler, 2007)? Lo que voy a argumentar a conti- nuación es que, aun cuando la digitalización nos obliga a redefinir nuestra noción de ‘texto’ porque se ha modificado su naturaleza y se ha abierto una intensa discusión sobre lo que este es, no se ha roto ni teórica ni práctica- 1219Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 mente con el paradigma de lo impreso. Con ese fin, me propongo mostrar que tanto las teorías sobre el texto digital desarrolladas por Dino Buzzetti, Manfred Thaller, Jerom McGann y Paul Caton, así como la concepción mis- ma de la codificación SGML/XML/TEI, que serán objeto de análisis de este artículo, preservan residuos de la concepción tradicional sobre el texto, que evidencian cuan poco las humanidades se han desprendido de nociones pro- venientes de la tecnología de lo impreso. En suma, sostendré que el camino hacia una ecología de digital no significa, todavía, una revolución dentro las humanidades, sino solo un paso dentro de un proceso evolutivo. ¿Un texto, muchos textos? El texto digital es casi tan antiguo como el cómputo. En un artículo clásico, Bush (1945) imaginó una máquina a la que denominó Memex, que pre- sentaba como un sistema en el que sería posible almacenar libros y archi- vos, y dentro del cual se pudiera mecanizar su consulta, de manera rápida y flexible. Memex permitiría, además, hacer anotaciones a los textos y rela- cionar estos entre sí, a partir de las propias anotaciones o las decisiones del lector, de modo que la organización dependiera de los intereses del usua- rio y no del catalogador. Para el teórico del hipertexto Landaw (1991), Bush reconocía en 1945 la necesidad de un texto virtual en lugar de un texto físico, para que las relaciones entre diversas obras estuvieran dadas por su lectura y no por su clasificación. Con ello, al menos de manera teórica, se abría la puerta a una nueva concepción del texto que no llegaría a realizarse sino hasta unas tres décadas después, con la aparición de los proyectos pioneros de digi- talización de textos, como el Proyecto Gutenberg en 1971 (Hart, 1992). A diferencia de otros proyectos en la lingüística y de la estilística, que fueron de los primeros en utilizar el procesamiento computacional para ob- tener resultados a partir del análisis de textos (Buzzetti y Thaller, 2012), la producción de ediciones digitales inauguró un nuevo campo problemá- tico en relación con la textualidad porque se tuvo que resolver una cuestión crucial para poder llevarse a cabo: ¿cómo se presenta el texto en la panta- lla de una computadora? 1220 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani La decisión tomada por el Proyecto Gutenberg fue hacerlo en Plain Vanilla ASCII (Hart, 1992), es decir, utilizando una codificación com- puesta por un set mínimo de caracteres definidos numéricamente, en un archivo que no ofrecía información más allá del texto mismo, para que pu- diera ser leído en cualquier sistema (figura 1). Figura 1. Los dos primeros versos de Amor condusse noi ad una norte, de José Villaurrutia en código ASCII El archivo no contenía ningún tipo de metadatos, pero tampoco ca- racterísticas tipográficas, como subrayados, negritas, páginas, encabezados o subtítulos; algunas de esas variantes, como los títulos, se representaban uti- lizando mayúsculas. Vistos a la distancia, los primeros textos digitales pre- sentaban un texto apenas suficiente para ser comprensible para un lector. En ellos podemos observar, por primera vez, la diferencia entre los datos alma- cenados en la computadora y el texto que aparecía en la pantalla. La diferen- cia estaba dada por la codificación ASCII que traducía los datos elementales del texto, como las letras, los espacios entre palabras, la puntuación, a un có- digo numérico, para que, desde ahí, la computadora lo interpretara para su posterior representación en el espacio de una pantalla (figura 1). Para Hi- llesund (2005) este es el cambio más significativo de la digitalización res- pecto del proceso de producción textual en lo impreso: The important and extremely consequential point of the digital shift is that the storing of the text is separated from its visual representation. In a digital text cycle, units of text are stored as bit patterns (usually in the codes od ASCII or Unicode) in a file. When writing is finished, the whole text is stored as a collection of bit patterns in a mass storage system, often a hard disk, completely separate from any representa- tion of the text. Esta separación entre la forma de almacenar el texto y presentarlo ha sido llevada al campo teórico. Como han señalado, entre otros, Buzzetti y Amar es una angustia, una pregunta, una suspensa y luminosa duda 065 109 097 114 032 101 115 032 117 110 097 032 097 110 103 117 115 116 105 097 044 032 117 110 097 032 112 114 101 103 117 110 116 097 044 013 010 117 110 097 032 115 117 115 112 101 110 115 097 032 121 032 108 117 109 105 110 111 115 097 032 100 117 100 097 059 1221Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 McGann (2006), para la computadora el texto es “información codifica- da como caracteres o secuencia de caracteres”. Para que tal secuencia ad- quiera sentido para un lector humano, es necesario que incorpore códigos específicos (ASCII, XML), que instruyan a la computadora sobre el modo de interpretar esos caracteres. Ese código, que acaba por ser parte del texto mismo, permite distinguir entre el texto (privado de código) y el que toma forma en la pantalla. Pero la diferencia entre el texto y su representación ha sido seña- lada por Buzzetti y Rehbein (1997) también para el caso de libro, donde la codificación estaría dada por las características materiales, tipográfi- cas, etcétera: It is true that “most of us almost automatically equate texts with prin- ted books”, but we should be wary of confusing “the form of repre- sentation”, or the properties of the book, “with the form of what is to be represented” (Buzzetti y Rehbein, 1997). Una inferencia que no deja de ser discutible porque equiparar las características físicas del libro con la codificación implica darle al texto impreso las características del texto digital, lo cual cuestiona enfáticamente, por ejemplo, Hillesund (2005). En todo caso, la ruptura de la identidad entre el texto y su repre- sentación, que los métodos de almacenamiento digital vuelven para- dójicamente tangible, conduce a una pregunta que, desde las llamadas humanidades digitales, ha intentado ser respondida: ¿qué es texto? Dos teorías acerca del texto De las aproximaciones teóricas al texto en las humanidades digitales, han destacado las propuestas por Dino Buzzetti en colaboración con distintos autores, y la que de manera más reciente ha propuesto Caton (2013). Am- bas sintetizan, a mi juicio, los ejes en que el debate se ha venido desarro- llando en los últimos años, y muestran las ventajas y los límites teóricos de las propuestas. 1222 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani Para Buzzetti y Rehnein (1997), el texto no es propiamente definido, pero señalan: “A textual representation is by necessity concrete and needs a physical support. Text, on the contrary, is abstract and may be conceived as the invariant content of all its material representations”. Abstracto es un término cauteloso para caracterizar al texto, pues lo describe solo a partir de la ausencia de cualidades concretas, reservadas to- das ellas a su representación. Pero abstracto supone, también para los au- tores, que es inexistente porque “a text comes into existence only through the representation of its content”. Con el concepto de ‘texto’ se estaría enfrentando aquí a los mismos problemas que toda teoría, en la que se postula un modelo que subyace a la existencia de expresiones concretas. Al describirlo como abstracto, inva- riante e inexistente, Buzzetti y Rehbein (1997) otorgan al texto un carác- ter semejante a lo noúmenico kantiano, pues entenderíamos por texto algo que no puede ser objeto de nuestra comprensión y lo suponemos “sólo como una abstracción de sus posibilidades sensibles” (Kant, 1972/2009). La renuncia a la idealidad del texto, propio de la filología clásica, para postular su abstracción ciertamente coloca el valor principal, la existencia, en las formas concretas, a diferencia de hacerlo en la forma puramente ideal. Pero esta fórmula, aunque constituye una variante, no rompe por completo con la idea de que el texto posee una identidad última, que es distinguible de sus expresiones individuales. Más adelante volveré sobre esta cuestión y las limitaciones que conlleva dentro de la concepción de las humanidades. Por su parte, Caton (2013) define *texto*2 a partir de tres caracte- rísticas que considera fundamentales. *texto* es “la representación escri- ta del lenguaje” que “muestra el intento de comunicar algo” y que “está completo dentro de su contexto” (being complete within its context). Es importante subrayar que las dos primeras características producen “an un- countable *text*”. Uncountable es un término de medida y es utilizado por Caton para hacer hincapié en que *texto*, en cuanto es definido por las dos 2 Esta es la notación utilizada por él, es para acotar el uso del término al campo de las humanidades digitales. 1223Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 primeras características, no es conmensurable. Por lo mismo, no es discer- nible, sino salvo cuando está completo en relación con un contexto. Este *text* inconmensurable es para él la materia textual. En sus pa- labras: “I suggest that the combination of characteristics one and two gives us *text* in the mass noun sense: *text* as material, as stuff ”. Examinemos con más cuidado esta afirmación, tratando de entender de dónde proviene el carácter material, de cosa, que le otorga al texto. Ca- ton es muy enfático al señalar que no intenta definir texto en general, sino solo el uso del término en el contexto de las humanidades digitales y, aún de manera mucho más restrictiva, su uso en el contexto de la codificación XML de las Guidelines for Electronic Text Encoding and Interchange (TEI) (Caton, 2013). Tomando en consideración estas advertencias, resulta más claro que Caton concibe *texto* como aquello dado que es una representación es- crita del lenguaje que intenta comunicar algo, a lo cual el contexto dará un sentido. Es difícil no pensar, incluso por los ejemplos ofrecidos por él, que se refiere con “an uncountable *text*” a entidades preexistentes a la codifi- cación: libros, carteles, telegramas, panfletos. De ahí el sentido material, de objeto que le confiere al texto. Pues contexto, como él aclara hacia el final del artículo, puede referirse a la primera edición de una obra o a una cita en un cartel, que se refiere a su vez a un discurso más extenso. Sorprende, sin embargo, que ese *texto* —el que está dado por las dos primeras características— sea precisamente uncountable, cuando es concreto. Precisamente porque supone que no tiene límites establecidos de antemano. En este sentido, su concreción en un libro o en un cartel no significa necesariamente que sea conmensurable. La definición de *texto* con las tres características integradas solo se produciría una vez que se vin- cule a un contexto determinado que, entiende, es definido por el editor di- gital del texto. Through questioning the notion of beingcomplete-within-contextual- bounds I concluded that being *a text* is a status we give some 1224 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani quantity of *text* (mass) in a particular context and at our choosing. Use of the definite article implies that the context is understood. Nor- mally, the context will be an abstraction that we always think of as bounded. Thus we speak of, for example, “the text of the first edi- tion”, where the abstract entity signified by “the first edition” supplies the conceptual boundary (Caton, 2013). En este sentido, para Caton, la edición de las 900 tesis de Pico della Mirandola hecha por Eucharius Silber en Roma en 1486, por ejemplo, po- dría ser, al mismo tiempo *text* o definir el contexto de un *a text*, pues el editor podría ver en ella una unidad rota con el Discurso sobre la digni- dad del hombre y la Apología, de Pico, e integrar las tres obras, apelando al contexto en que se produce la disputa romana de Pico. En ese sentido, las tesis serían *text* hasta que se completara con la adición de las otras dos obras. Pero la misma edición de Eucharius Silber podría ser la base contex- tual de un *a text* tomada de manera singular, si el editor decide que esa edición es suficiente para entender conceptualmente la obra. En suma, el editor decide cuándo una cierta “masa textual” es un texto, cerrado y com- pleto, y cuándo no. A pesar del mayor realismo dentro del cual intenta moverse Caton, tampoco renuncia del todo a la idea de que el texto tiene una identidad más allá de sus representaciones concretas. Que esta identidad sea tratada como material es solo relativa, pues en el fondo es inconmensurable y, por tanto, indefinida. Lejos de oponerse entre sí las definiciones analizadas hasta aquí, am- bas resultan ser muy semejantes. Supone que hay que pensar el texto de dos maneras distintas. Por un lado, una que podríamos llamar de origen, que caracteriza al texto por su indeterminación y, por otro, una donde texto es determinado, ya sea por la representación, ya sea por la decisión del editor. Ambas separan el contenido del medio que lo transmite, y suponen que la co- dificación es capaz de restituir el texto original en una infinidad de variantes. Esta semejanza en la estructura de la reflexión sobre el texto, a pesar de una escalonada renuncia a la idealidad, lleva a pensar que la discusión sobre la naturaleza del texto no se limita a identificar una posición “más realista”, 1225Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 como la de Caton (2013), o “menos realista”, como la de Buzzetti y Rehbein (1997), y posicionarse entre ellas, sino en discutir lo que está a la base de ambas, y qué comparten. Como señalan Fiormonte, Geri y Silvi (2006): […] l’esigenza di ricostruzione del testo ereditata dalle filologie clas- sica e medievale si è sposata felicemente con l’idea di modello as- tratto (Buzzetti 2002), e con la promessa che a partire da un unico “meta-testo” (il documento codificato) fosse possibile ricavare diver- se edizioni su diversi supporti. La crítica puede dirigirse con las mismas palabras a Caton, quien in- dependientemente de que no imagine el texto como una entidad abstracta, sí la piensa como inconmensurable, lo cual plantea un problema semejante. En realidad, la cuestión aquí recae en que esta idea de la identidad última del texto con su forma indeterminada no es sino un residuo, menos idea- lista, más fenomenológico, de la idea clásica de texto. No podemos negar que en estas propuestas teóricas haya un movimiento, un redimensiona- miento del concepto a la luz del nuevo entorno digital, pero este no es tan amplio como para constituir una idea que se haya desprendido realmente de lo impreso y de los principios de la filología clásica formada en él. Este desplazamiento no es, sin embargo, privativo de la teoría. Lo en- contramos en el corazón mismo de la concepción del texto para proponer la forma y estructura de su codificación, con la pretensión de construir una representación que pudiera incluir la totalidad de sus variantes. ¿Representarlo todo? Para Buzzetti y Robhen (1997), el marcado de texto con una codifica- ción XML es entendido como “all the information in a document other tan the ‘contents’ of the document itself, viewed as a stream of charac- ters”. En este sentido, […] any information present about formatting (margins, font shifts, page breaks) is given by markup. All structural information, all rela- tionships among texts, apparatus, and notes, is given by markup. All analytic or interpretive information to be included in an electronic text is by definition expressed as markup. 1226 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani Como se desprende de esta cita, el proceso de codificación con el mar- cado del texto agrega a este un espectro enorme de información, con la cual, al menos idealmente, podría formase un único metatexto que representarse todas las variantes posibles de un mismo texto, como esperaba Cerquiglini (1999) que podría hacerse con la inclusión del texto digital en la filología. Pero el problema es que la codificación tiene límites que hacen im- posible, incluso no deseable, cumplir con esta promesa. Las decisiones to- madas para representar el texto con la codificación SGML/XML/TEI son una extensión de la concepción de texto impreso (Hillesund, 2005) y, en esa medida, fue concebida como una extensión instrumental para los es- tudios humanísticos. El modelo para describir lo que es un texto responde, desde la década de 1980, con el establecimiento del SGML (Standard Generalized Markup Language) como modelo de codificación, a una serie de ideas que estable- cen los límites que aún tiene este sistema. En síntesis, estas ideas pueden ser enunciadas de la siguiente forma: 1. El texto tiene una fuente única (Hillesund, 2005). 2. Su estructura es anidada (DeRose et al., 1997). 3. No se define como un modelo de datos (Renear, Dubin y Sperberg- McQueen, 2002). 4. Su sentido tiene que ser definido más allá de la codificación (Dubin y Birnabaum, 2004). Como se apuntaba apenas unos párrafos arriba, la promesa principal de la digitalización era la posibilidad de representar todas las variantes po- sibles de un texto. Paradójicamente, el modelo SGML/XML/TEI trata de lograr esa promesa a partir de mantener el principio de que el texto tiene una sola fuente y que, por tanto, puede ser separado de la forma en que apa- rece, sin que esto afecte al texto. El presupuesto es claro: la única manera de ofrecer todas las variantes de un texto es que este no dependa, de ninguna manera, de su expresión concreta, de manera que todas sus formas concre- tas puedan ser integradas finalmente en un solo metatexto. 1227Palabra Clave - ISSN: 0122-8285 - Vol. 18 No. 4 - Diciembre de 2015. 1215-1234 Para Hillesund (2005) esta idea descansa “on the false supposition that any kind of written or verbal content can be presented at will in any medium and for whatever propuse”. Igualmente falsa es la idea de que todo texto puede ser asimilado a un texto único como resultado del proceso de su codificación no solo por sus inconvenientes prácticos (Fiormonte, Geri y Silvi, 2006), sino también teóricos, al plegar la multiplicidad de las formas en que aparece la escritura al espacio uniforme del texto codificado. Ade- más, las propias limitaciones del modelo SGML/XML/TEI mostrarán las dificultades para cumplir con este ideal. Desde su concepción en la década de 1980, el modelo de represen- tación textual SGML/XML/TEI responde a la idea expresada en la tesis de DeRose et al. (1997) de que el texto es “essentially composed of nes- ting objects such as chapters, sections, paragraphs, extracts, lists, and so on” (Renear, Mylonas y Durand, 1993). En la práctica, este modelo implica dos cosas: 1) que se renunció a otros modelos posibles de representación, como pueden ser una estructu- ra de objetos diseñados, matrices de pixeles u otras utilizadas en el cóm- puto (Renear, Dubin y Sperberg-McQueen, 2002), incluso la estructura de bases de datos (Schloen y Scholen, 2014), y 2) que, al optar por una es- tructura de jerarquías de objetos anidados para representar el texto —una página forma parte de un capítulo, que forma parte de un libro, etcétera—, se dificulta presentar un mismo texto (o una fracción de él) bajo dos carac- terísticas diferentes. Por ejemplo, codificar las características tipográficas de una palabra y su función como título o diferenciar el nombre propio de la referencia a una persona, lo cual se conoce como el problema del over- laping (Renear et al., 2002; Schloen y Scholen, 2014, Eggert, 2005, Buzzetti y Thaller, 2012). El overlaping representa una dificultad práctica porque obliga a repre- sentar cualquier aspecto del texto como una jerarquía ordenada, o bien como una subjerarquía ordenada (Renear, Mylonas y Durand, 1993), eliminando las posibilidades de representar, por ejemplo, “estructuras de información, como las variantes abiertas, que violan el principio de correspondencia” (Fiormonte y Martiradonna, 2010). 1228 El texto digital y la disyuntiva de las humanidades digitales - Ernesto Priani Incluso, desde un punto estrictamente pragmático, lo que hace que el lenguaje de marcado sea un éxito es su límite, porque “il grado di fedeltà alla fonte originaria è proporzionale al grado di astrazione che il linguaggio rende possibile, più aumenta la complessità del documento, più comples- so e verboso il markup e maggiori le difficoltà di visualizzazione e dunque di accesso a esso (Fiormonte, Geri y Silvi, 2006). Las reglas definidas SGML/XML/TEI, además, ofrecen solo un voca- bulario y una sintaxis, pero no una semántica para ese vocabulario (Renear et al., 2002). En este sentido, como señalan Buzzetti y Thaller (2012), “for embedded markup provides a data structure, but it does not beget a suitable data model”, en la medida en que no hay “one-to-one correspondence bet- ween the logical form of a phrase and the structure of its semantic content”. La conciencia principal de esto, al mismo tiempo una de las mayores fortalezas del modelo, es que cualquiera de las marcas (tómese por ejem- plo,