page_0102
Facsimile
usuarios a volverlo a enviar? ¿Cuántos campos es probable que alguien complete? ¿Qué campos deberían ser obligatorios y cuáles opcionales? Estas son cuestiones de investigación de las ciencias sociales y del desarrollo de la interacción humano-computadora y debido al desarrollo de este tipo de sistemas para construir colecciones digitales, ahora se han convertido en preguntas centrales para la biblioteconomía. Aún no tenemos las respuestas a estas preguntas. La conclusión aquí es que este tipo de preguntas ahora son fundamentales para el trabajo de las instituciones que resguardan el patrimonio cultural. Las instituciones de resguardo de patrimonio cultural deben invertir tiempo, recursos y personal para tener éxito en la producción de interfaces de recopilación compresivas, consistentes y utilizables. Las decisiones de diseño sobre cómo estructurar las aportaciones e interacciones de los usuarios dejarán una marca duradera en el contenido y la estructura de esas colecciones.
Descripciones vinculadas y en red
Muchos objetos digitales se indexan, describen y anotan entre sí. Por ejemplo, si se toman todos los enlaces que aparecen en los artículos publicados en Drudge Report, el hecho de que Drudge Report se vincule a esos sitios informa algo sobre ellos. Volviendo a los ejemplos de todos los metadatos individuales en un tweet, si se toman todos los tweets que un político importante ha hecho a lo largo del tiempo, se termina con un conjunto coherente de tweets pero también con una serie de anotaciones de las URL mencionadas en esos tweets. Es decir, si se toma cada tweet en esa colección que menciona alguna URL en específico y todos los tweets de otras colecciones que mencionan esa misma URL, se tiene mucha información que describe, contextualiza y comenta cualquier recurso que resida en esa URL. Este conjunto de conexiones vinculadas se convierte en una poderosa forma de contexto.
Los alcances de esto se relacionan con temas del capítulo anterior que habla del desarrollo de colecciones. Por ejemplo, varios proyectos web de recoleccción han utilizado un conjunto de información como medio para identificar el contenido que se debe recopilar. La Biblioteca Nacional Británica desarrolló twittervane, una herramienta de código abierto para recopilar las URL mencionadas en los tweets que aluden a un término determinado. 94 Del mismo modo, Internet Archive creó una colección de archivos web utilizando las URL extraídas de los 13 millones de tweets que mencionan el hashtag de Ferguson en las protestas después del asesinato de Michael Brown. En estos casos, una colección digital se convierte en la base para determinar el alcance de otra y las dos funcionalmente se glosan y sirven de contexto entre sí.
Las técnicas de procesamiento del lenguaje natural, los métodos computacionales para identificar patrones en el texto se utilizan cada vez más para mostrar las relaciones entre objetos y metadatos descriptivos. Existen potentes cajas de herramientas de código abierto para la extracción de entidades por nombre (un enfoque para identificar nombres de personas, nombres de lugares, fechas y horas expresados en una variedad de formas textuales) y los investigadores están trabajando en la aplicación de estas técnicas a posibles aplicaciones para ayudar a la descripción de objetos. A medida que se perfeccionen estas tecnologías, será posible que un bibliotecario o un archivista las ejecute sobre un corpus de texto, o aplique técnicas computacionales visuales o de texto hablado sobre colecciones de imágenes o audio y así vincular, etiquetar y clasificar el contenido según las sugerencias proporcionadas por estas tecnologías computacionales.
Es apropiado enmarcar a casi todos los objetos digitales como datos en sí mismos así como metadatos que describen otros objetos. Para este fin, se debe pensar en "la descripción" y "lo descrito" como un límite difuso. El futuro implicará descubrir cómo aprovechar el hecho de que
___________________
94 Para una discusión sobre el proyecto TwitterVane y el trabajo relacionado, vea Milligan, Ruest y Lin, “Content Selection and Curation for Web Archiving.”
Notes and Questions
Please sign in to write a note for this page