The Theory and Craft of Digital Preservation

ReadAboutContentsHelp

Pages

page_0026
Complete

page_0026

Entendiendo los objetos digitales

"Construimos nuestras computadoras de la misma manera que construimos nuestras ciudades - con el tiempo, sin un plan, sobre ruinas." - Ellen Ullman (1998)

"La mayoría de las personas prefieren permanencer en la superficie de las cosas." - Vivian Jaffe (2004)

Hacer preservación digital requiere de un entendimiento fundamental de la estructura y naturaleza de la información y de los medios digitales. Este capítulo trabaja para proporcionar dichos antecedentes a través de tres líneas relacionadas con la beca de estudios de nuevos medios. Primero, toda la información digital es material. Segundo, que la base de datos es una forma esencial de medios para entender la lógica de los sistemas de información digitales. Tercero, que la información digital es entendida de mejor forma existiendo en y a través de un conjunto de plataformas anidadas. Comenzaré dando primero una visión general de cada uno de estos tres puntos para después profundizar en ellos.

Cada vez que se almacena información digital, se codifica físicamente en los medios. Es crítico el reconocer que el flujo de bits sin procesar (la secuencia de unos y ceros codificados en el medio original) tiene una habilidad tangible y objetiva para ser grabada, copiada y verificada. Esto proporciona una base esencial para la preservación digital. Sin embargo, por complejo que sea un sistema digital, en algún lugar hay una información binaria codificada en un medio físico tangible. Con ese fin, es posible establecer qué es la secuencia entera de bits en un medio dado, o en un archivo dado, y usar técnicas para crear una especie de huella digital que puede ser utilizada para verificar y autentificar copias perfectas. En este nivel de flujo de bit físico, hay una linealidad inherente a la información digital. Donde sea que la información esté codificada, hay un primer bit, un segundo bit y un último. Sin embargo, esta característica es abstraída al nivel de la recuperación y el manejo de la información que resulta en algo radicalmente diferente a la mayoría de nuestros otros medios.

La lógica de los medios computacionales es, en general, la lógica de la base se datos. Donde el indíce o el códex pueden proporcionar una metáfora valiosa para el orden y estructura de un libro, la beca de estudios de nuevos medios sugiere que la base de datos es y debería abordarse como la metáfora fundamental de los medios digitales. Desde esta perspectiva, no hay una “primera fila” persistente en una base de datos, sino que la presentación y acomodo de la información digital está basada en la solicitud planteada a los datos. Dado que las bibliotecas y archivos han basado durante mucho tiempo sus concepciones del orden en las propiedades del papel y los libros, adoptar esta lógica en bases de datos tendrá implicaciones significativas al momento de hacer que el material digital esté disponible a largo plazo.

Los sistemas digitales son plataformas sobrepuestas entre sí. Mientras que los flujos de bits son lineales, la lógica de la base de datos de nuevos medios funciona en una manera no muy lineal. En el nivel base, esos flujos de bits lineales son animados, renderizados, manipulados, alterados y hechos utilizables a tráves de capas anidadas de plataformas. Al acceder a un objeto digital, los equipos de cómputo interactúan con las estructuras de los sistemas de archivos, formatos de archivos y varias capas adicionales de software, protocolos y controladores. Trabajar con algunos ejemplos ayudará a aclarar este concepto. La experiencia del desempeño de un objeto en una pantalla en particular, como jugar un videojuego o leer un documento, puede ofuscar por sí misma muchos de los aspectos importantes de los objetos digitales que son interesantes e importantes pero mucho menos visibles, como la forma en la que un conjunto de reglas de un videojuego realmente funciona o el texto eliminado en un documento que aún existe pero no se despliega en la pantalla.

Last edit over 3 years ago by ac
page_0027
Complete

page_0027

Como resultado de esta naturaleza de plataformas anidadas, los límites de los objetos digitales frecuentemente son completamente dependientes de la capa que uno considera ser la más significativa para un propósito dado. En este contexto, la forma digital y los formatos deben entenderse como existentes de un tipo de contenido. A través de estas capas de plataforma, los objetos digitales son siempre una multiplicidad de cosas. Por ejemplo, un videojuego de Atari es un objeto tangible que puedes sostener, una secuencia binaria de información codificada en un medio idéntico a todas las copias de ese juego, un código fuente creado como un trabajo creativo, un producto empaquetado vendido y comercializado para una audiencia, y un significante de cualquier cantidad de aspectos de un momento histórico en particular.23 Cada uno de estos objetos puede coexistir en las capas de la plataforma de un objeto tangible, pero dependiendo de cuál sea el significado para un propósito en particular, uno podría desarrollar un enfoque de preservación diferente.

En lo que sigue, profundizaré más en cada uno de estos tres puntos; la materialidad de los objetos digitales, la bases de datos y la naturaleza de la plataforma de nuevos medios. En todo, proporcinaré una serie de ejemplos para demostrar cómo estos puntos son relevantes para entender los objetos digitales de una forma que nos permita empezar a pensar en preservarlos. Luego trabajaré a través de unos cuantos ejemplos que unen estos conceptos junto con otros cuantos puntos conceptuales clave para comprender los medios digitales.

Lo digital es siempre material

Mucho del lenguaje que utilizamos para hablar acerca de los medios digitales ofusca la materialidad de la información digital. Mis archivos de Google doc están en algún lugar en la “nube” que suena a metafísica. No se equivoquen: La nube está hecha por las computadoras de otras personas. Ésto es por sí mismo un desafío central en el trabajo con objetos digitales y medios. El disco duro en su computadora es a veces, literalmente una caja negra. Dentro de esa caja negra está un mecanismo complejo que codifica información a una escala tan pequeña que no puede verse24.

En otro nivel, la mayoría de las personas entiende que la información digital está hecha de “bits” que frecuentmente evocan una imagen en mi mente de unos y ceros fluyendo en una pantalla como en la película The Matrix. Si busca el término “bits” en la búsqueda de imágenes de Google, encontrará una imagen mostrando unos y ceros en una pantalla, muchas de las cuales son tomadas en un ángulo para sugerir movimiento. Lo que no encontrará es una imagen como la imagen siguiente. Esos unos y ceros son la unidad fundamental más baja de la información digital. Sin embargo, la visión de ellos fluyendo de una pantalla no consigue capturar la naturaleza física y material de la información digital.

_______ 23 Para una explicación de la variedad de cosas que es un juego de Atari, véase Bogost, Alien Phenomenology. 24 El argumento en cuestión sobre la materialidad de los objetos digitales es una versión corta de los muchos puntos de los primeros dos capítulos de Kirshenbaum, Mechanisms.

Last edit over 3 years ago by ac
page_0028
Complete

page_0028

Grabación de magnetizaciones individuales de bits en un disco duro de 200MB (grabación visualizada usando CMOS-MagView).

Aquí puede observar las magnetizaciones de bits individuales codificados en bandas en un disco duro. A este nivel, el nivel de micras, cada unidad inscrita de información es muy física y tangible. Cada bit tiene dimensiones. A la larga, leer y escribir en cualquier sustrato de medios subyacente involucra una traducción de digital a analógico y viceversa. Es decir, un bit de información es codificado en el medio y después es leído de regreso de él.

Este punto no solo es verdadero para discos duros. Puede realmente ver los bits individuales en una tarjeta perforada o en un rollo de cinta perforada. La presencia o absencia de una perforación es leída como un 1 o un 0 y es facil ver que cada perforación tiene una longitud y un ancho. Algunos podrán ser ligeramente más anchos o más largos que otros, o ligeramente desordenados, pero mientras se ajusten lo suficiente como para ser leídos e interpretados, funcionan para almacenar información codificada. Un CD regrabable usa un láser para codificar bits en un tinte. En la mayoría de los CDs y DVDs comerciales, la información es codificada en pequeñas hendiduras llamadas pits. Esos pits son leídos por un láser en una unidad CD o DVD. En el caso de las unidades flash, las pequeñas unidades USB que la mayoría de las personas llevan en sus llaveros y la base de la memoria dentro de los teléfonos móviles, los electrones son almacenados en partes de los medios. Esos electrones existen en los límites de lo que incluso podríamos llamar material. Pero tenga por seguro que los electrones son una gran parte de nuestro universo material y no existen en una especie de plano metafísico.

Todos estos ejemplos son para subrayar un punto clave. Toda la información digital es material. Ésto tiene una implicación crítica para el trabajo de preservación digital. Por complejo o desafiante que sea un objeto o trabajo digital, en algún lugar hay un objeto físico que tiene una secuencia lineal de marcas en el flujo de bits. Esa secuencia de bits puede leerse desde el medio, comprobar su precisión y copiarse a otro medio. Este proceso de “preservación de bits” es relativamente sencillo y bastante fácil de verificar. Dicho esto, esos bits son realmente solo útiles para nosotros cuando podemos renderizar e interactuar con ellos, lo cual es posible a través de otro aspecto clave de los medios digitales.

Last edit over 3 years ago by ac
page_0029
Complete

page_0029

Cualquier cosa puede estar primero en una base de datos

Click derecho. Ordenar por. Estas son dos de las operaciones más básicas que los usuarios de computadoras alrededor del mundo usan. En cualquier número de aplicaciones puede organizar archivos, canciones, emails, etc. por su nombre, fecha de creación, fecha de última apertura, autor, tipo de archivo o tamaño del archvio. En la mayoría de los sistemas operativos usted puede similarmente cambiar lo que puede ver acerca de cada uno de estos archivos. Puede verlos en una vista de lista, verlos con íconos grandes o pequeños, o con todos sus detalles en columnas cuyos encabezados son indicaciones para organizar el despliegue de información. La gramática de estas interfaces, el filtrado y la clasificación, se repite a sí mismo en casi cada nivel de abstracción en computación. A este punto, el académico en medios Lev Manovich explica: “Como una forma cultural, la base de datos representa al mundo como una lista de elementos y se niega a ordenar esta lista”.25 Nuestra relación con la información digital está anclada en la interfaz y una base de datos. En esa relación, la idea del orden y la secuencia subyacentes es reemplazada por una multiplicidad de órdenes. Se reemplaza con una amplia gama de posibilidades de secuencia. Esto es fundamentalmente diferente de la forma en la que interactuamos con medios analógicos. 26

Es verdad. Incluso en el nivel base del disco duro que acabamos de explorar, esas unidades están, a su vez, divididas en sectores. Los sectores de la unidad son administrados a través de tablas (en términos de base de datos, listas de valores almacenados en filas). Entonces, mientras la información en la unidad, el flujo de bits, es depositado de una forma lineal, la unidad abstrae esos sectores en un volumen de espacio coherente hecho disponible para la computadora para que usted la use como almacenamiento de archivos.

Esta lógica de base de datos se entiende mejor al contrastarla con algunas de las lógicas lineales y referenciales que han sido una parte clave en otros medios. Por ejemplo, el codex, la unión de páginas en un libro, me permite referirme a la página 23 de este libro para que usted rápidamente vaya a la página 23 y vea lo que estoy referenciando. De igual forma, usted puede pasar al índice al final de este libro y ver y encontrar un índice diferente al libro en comparación con el lineal que proviene de pasar cada página de forma individual. Por ejemplo, si usted estuviera interesado en dónde hablo acerca de bases de datos, usted podría buscar la entrada para bases de datos en el índice e identificar cada una de las páginas en donde noté y discutí el concepto dentro del libro (como muchos libros académicos, tuve que preparar el índice para este libro en particular).

El índice en este libro tiene un poco de la lógica de base de datos en él. Es un poco como elegir diferentes maneras para ordenar el libro. En este aspecto, es de cierta forma similar a cómo usted puede ordenar la información en su computadora. Mas allá del índice, todavía hay más formas de crear diferentes tipos de índices para un texto que consumen más tiempo. Por ejemplo, una concordancia enlistaría las palabras clave en un libro dado junto con su contexto. Entonces, si este libro tuviera una concordancia, en realidad incluiría cada oración en la que la palabra aparece. Eso le permitiría leer todos los contextos en un solo lugar en lugar de ir a cada página para ver el contexto.

Entonces, la lógica de base de datos ha estado desde hace tiempo con nosotros. No es nada nuevo que vino con los medios digitales. Sin embargo, no era lo predeterminado. Tomó mucho trabajo para hacer que los medios analógicos actuaran como una base de datos. Lo predeterminado con un libro es pasar de una página a la página siguiente. Por el contrario, para muchos leyendo este libro en una computadora o dispositivo móvil, usted pudo haber oprimido Ctrl-F y buscado cualquier término en el que estuviera interesado y usado eso como su punto de entrada al texto

_________ 25. Manovich, "Dtabase as a Genre of New Media." 26. Manovich se expande en este enfoque en la lógica de base de datos en The Language of New Media.

Last edit over 3 years ago by ac
page_0030
Complete

page_0030

La búsqueda en sí es uno de los aspectos centrales de la lógica de base de datos. No leemos bases de datos. Las consultamos. Uno de los mitos clave (por no decir que es falso, sino que ha alcanzado el nivel de recuento para funcionar como leyenda) de la World Wide Web es que Yahoo, originalmente comenzó como Jerry and David’s Guide to the World Wide Web trabajó como una lógica de “organizar el contenido” elaborando a mano índices de sitios sobre temas. Por el contrario, los advenedizos de Google desarrollaron PageRank, un algoritmo que computacionalmente indexó la web y ponderó los resultados en función de enlaces entre páginas web. La historia es útil para considerar y regresarla a los bibliotecarios y archivistas. ¿Estamos tratando ser como Yahoo y acercarnos a cierto contenido digital como crear el índice de un libro, donde gastamos tiempo considerable tratando de organizarlo y describirlo, en lugar de actuar como Google, y dedicar nuestro tiempo encontrando una forma de sacar a la superficie las relaciones de los datos subyacentes?

Otro aspecto clave de esto es que el orden y secuencia han sido una parte central del manejo de colecciones de las bibliotecas; esta lógica de base de datos permite que el orden y la secuencia caigan a un lado. O más específicamente, los medios digitales permiten la multiplicidad de órdenes y secuencias. Un sistema de archivos vertical o libros acomodados acorde al sistema de clasificación de la Biblioteca del Congreso se organizan en función de los límites reales del espacio físico. Cada cosa puede estar en un solo lugar. Por lo tanto, en muchas universidades puede recorrer las pilas de la biblioteca y encontrar este libro en el estante, seguramente entre las Z con los demás libros de bibliotecología y ciencias de la información. Usted no puede, sin embargo, hacer click derecho en los estantes y ver todos los libros ordenados alfabéticamente por autor, o por título de algún tema. Usted puede hacer esto con los registros en el catálogo en línea, pero en computación son las cosas en sí las que están siendo cambiadas y reordenadas. Este tipo de acomodo ha sido una parte central del trabajo de las bibliotecas y los archivos, y tiene sentido que lo haya sido, ya que ha sido una parte clave en nuestra habilidad para encontrar y acceder a estos objetos a través de sus ubicaciones físicas. Es importante destacar que el desarrollo del catálogo de tarjetas es en sí un ejemplo clave de cómo las bibliotecas por mucho tiempo han hecho uso de este tipo de lógica de base de datos como un medio de permitir una multiplicidad de pedidos. Es un punto para más adelante en este libro, pero vale la pena subrayar que la inherente lógica de base de datos ha estado en juego durante mucho tiempo para la bibliotecología y ciencias de la información pero siempre ha sido una empresa masiva, algo que ha trabajado como un tipo de resistencia en contra de los materiales de libros, papel y archivos. En contraste, para los medios digitales en los que la lógica de base de datos es la predeterminada. Es algo que en lo que el campo tiene aún un gran camino por recorrer para adoptarlo por completo.

En el futuro, es crítico el recordar que: 1) siempre hay una secuencia de unos y ceros codificada en un medio subyacente tangible y que: 2) a través de todos los niveles de abstracción que estamos por discutir, la información se accede y se manipula a través de esta lógica de base de datos. El resto de este capítulo se basa en estos dos puntos y trabaja desde el medio para explorar las relaciones entre los diferentes tipos de plataformas en objetos digitales. En este contexto, luego desempaquetaré una serie de características clave resultantes de los medios digitales que resultan de esta naturaleza de plataforma.

Son plataformas todo el camino y hasta el fondo

_____ 27 Para una historia extensa del desarrollo de los catálogos de tarjetas, véase Krajewski, Paper Machines.

Last edit over 3 years ago by ac
Displaying pages 26 - 30 of 138 in total