page_0102

OverviewVersionsHelp

Facsimile

Transcription

Status: Complete
Show Translation

enviar de nuevo si la información no está allí, saber ¿Cuántos campos es probable que alguien complete? ¿Qué campos deberían ser obligatorios y cuáles opcionales? Estas son preguntas de investigación en ciencias sociales y desarrollo de interacción humano-computadora y de los desarrolladores de sistemas para construir colecciones digitales, que ahora se han convertido en preguntas centrales para la biblioteconomía. Aún no tenemos las respuestas a estas preguntas. La conclusión aquí es que este tipo de preguntas ahora son fundamentales para el trabajo de las instituciones que resguardan del patrimonio cultural. Las instituciones de resguardo de patrimonio cultural deben invertir tiempo, recursos y personal para tener éxito en la producción de interfaces de recopilación compresivas, consistentes y utilizables. Las decisiones de diseño sobre cómo estructurar las aportaciones e interacciones de los usuarios dejarán una marca duradera en el contenido y la estructura de esas colecciones.

Descripción vinculada y en red

Muchos objetos digitales se indexan, describen y se anotan entre sí. Por ejemplo, si toma todos los enlaces que aparecen en los artículos publicados en Drudge Report, el hecho de que Drudge Report se vincule a esos sitios le informa algo sobre ellos. Volviendo a los ejemplos de todos los metadatos individuales en un tweet, si tomaste todos los tweets que un político importante hizo a lo largo del tiempo, terminas con un conjunto coherente de tweets pero también con una serie de anotaciones de las URL mencionadas en esos tweets. Es decir, si tomas cada tweet en esa colección que menciona alguna URL en específico y todos los tweets de otras colecciones que mencionan esa URL, se tiene mucha información que describe, contextualiza y comenta cualquier recurso que resida en esa URL. Este conjunto de conexiones vinculadas se convierte en una poderosa forma de contexto.

Los alcances de esto se relacionan con temas del capítulo anterior que habla del desarrollo de colecciones. Por ejemplo, varios proyectos de cosecha web han utilizado un conjunto de información como medio para identificar el contenido que se debe recopilar. La Biblioteca Nacional Británica desarrolló twittervane, una herramienta de código abierto para recopilar las URL mencionadas en los tweets que aluden un término determinado. 94 Del mismo modo, Internet Archive creó una colección de archivos web utilizando las URL extraídas de los 13 millones de tweets que mencionan el hashtag de Ferguson en las protestas después del asesinato de Michal Brown. En estos casos, una colección digital se convierte en la base para determinar el alcance de otra y las dos funcionalmente se apuntan y sirven de contexto entre sí.

Las técnicas de procesamiento del lenguaje natural, los métodos computacionales para identificar patrones en el texto se utilizan cada vez más para mostrar las relaciones entre objetos y metadatos descriptivos (¿el qué?, en). Existen potentes kits de herramientas de código abierto para la extracción de entidades por nombre (un enfoque para identificar nombres de personas, nombres de lugares, fechas y horas expresados en una variedad de formas textuales) y los investigadores están trabajando en aplicar estas técnicas a posibles aplicaciones para ayudar a la descripción de objetos. A medida que se perfeccionen estas tecnologías, será posible que un bibliotecario o un archivista las ejecute sobre un corpus de texto, o aplique visión por computadora o de texto hablado, sobre colecciones de imágenes o audio, y así vincular, etiquetar y clasificar el contenido según las sugerencias proporcionadas por estas tecnologías computacionales.

Es apropiado elaborar objetos casi totalmente digitales con ambos datos los de sus propios derechos de uso y metadatos que describen otros objetos. Para este fin, debemos pensar en "la descripción" y "lo descrito" como un límite difuso. El futuro implicará descubrir cómo aprovechar el hecho de que

___________________
94 Para una discusión sobre el proyecto TwitterVane y el trabajo relacionado, vea Milligan, Ruest y Lin, “Content Selection and Curation for Web Archiving.”

Notes and Questions

Please sign in to write a note for this page

AnaYuri

(among what?) se tradujo como (¿el qué?, en) sin embargo, se aceptan sugerencias