Organizando mi biblioteca digital

 Lun, 14/04/2014 - 19:50     Sandor

Biblioteca

Siempre he tenido un poco de síndrome de Diógenes, aunque con la edad, he logrado trasladarlo al mundo virtual (un piso de 45 metros y poseer una tablet y un ebook también ha ayudado a el cambio, lo reconozco) :-)

El caso es que, además de los miles de mp3 y los cientos de videos, se me han ido acumulando miles de libros, recortes de periódico escaneados (no era broma lo del síndrome), manuales, catálogos, etc, en los más diversos formatos. Al principio solía organizarlos por carpetas temáticas, por ejemplo: Informática, Literatura, Viajes, etc. pero repasando los apuntes de un curso en la U.N.E.D. que hice sobre biblioteconomía, decidí que la manera más lógica de organizarlo todo era partir de la C.D.U (Clasificación Decimal Universal), pero no la versión completa, ni siquiera la abreviada, si no una que encontré en esta página de una sección de Bibliotecas Escolares perteneciente al Ministerio de Educación. Por supuesto, optar por una u otra versión solo depende del ánimo que tengas a clasificarlo todo en el tema específico del que se trate, y de la cantidad de información a clasificar. Pero como os cuento, a mi me vale con esta clasificación simplificada, pensada para bibliotecas escolares. Son 18 páginas de materias, estructuradas jerárquicamente en forma de árbol, que va desde lo general a lo específico. Las materias comienzan con un número, seguido del nombre. Así por ejemplo, nos encontramos con:

9. Geografía. Biografía. Historia.
902 Arqueología.
903 Prehistoria. Restos prehistóricos.
904 Restos culturales de tiempos históricos.
908 Descripción geográfico-histórica de un territorio, una localidad.
91 Geografía general. Historia de la geografía.
910 Geografía como ciencia. Cuestiones generales. Viajes.
910.4 Viajes de descubrimientos. Expediciones.
911.2 Geografía física.
911.3 Geografía humana, social y cultural.
912 Mapas. Atlas geográficos. Globos terráqueos.
913 Geografía del mundo antiguo. Geografía regional en general.
914 Geografía de Europa.
914.60 Geografía de España.
914.601.1 Geografía de Galicia.
914.601.2 Geografía del Principado de Asturias.
914.601.3 Geografía de Cantabria.
914.601.5 Geografía del País Vasco.

¿Entendeis el concepto, no? Básicamente este sistema nos ofrece un método contrastado de clasificación de la información, un método ampliamente usado en bibliotecas de todo el mundo. Así que si les sirve a los profesionales de la documentación, digo yo que también me podrá servir a mí :-)

Como os cuento, lo que hago es ir creando, a medida que voy necesitando, carpetas con el nombre de la materia (número incluido). Al principio creo el nivel general, por ejemplo:

51 Matemáticas
52 Astronomía. Astrofísica. Investigación espacial. Geodesia
53 Física
54 Química
55 Geología y ciencias afines. Geología regional
56 Paleontología. Fósiles
57 Ciencias biológicas en general
61 Medicina
63 Agricultura

Y voy metiendo cada archivo en su categoría general. Cuando veo que la carpeta 51 Matemáticas (por ejemplo), tiene unos cuantos cientos de archivos, me planteo crear subdivisiones dentro de ella:

511 Aritmética. Teoría de los números.
512 Álgebra.
514 Geometría.
517 Análisis matemático.
...

Y cuando tengo un rato (y ganas), muevo los archivos de la carpeta 51 Matemáticas dentro de la sub-temática que le corresponda.

A veces, como no soy un profesional del tema, me falta acierto para clasificar adecuadamente un archivo, y dudo entre ponerlo en una categoría u otra. ¡No hay problema! Como tengo la biblioteca en un servidor que corre GNU/Linux (concretamente Debian), simplemente tengo que hacer un enlace simbólico del archivo a la otra categoría y me aparece en ambas.

Esto que os cuento digamos que sería un primer paso para organizar una biblioteca digital de una manera medianamente ágil. Pensé en instalar Koha, Eprints o algún software similar, pero me pareció un poco matar moscas a cañonazos.

Lo que sí que me parece interesante, y que más pronto que tarde intentaré implementar en el servidor, es instalar un buscador (probablemente Xapian), que me indexe todos los archivos de la biblioteca y me ofrezca un interfaz de búsqueda para poder encontrar archivos en base a su contenido. Entre sus características, Xapian permite indexar documentos HTML, PHP, PDF, PostScript, OpenOffice/StarOffice, OpenDocument, Microsoft Word/Excel/Powerpoint/Works, Word Perfect, Abiword, RTF, DVI, CSV, SVG, paquetes RPM, DEB y texto plano. Además, es posible extender su capacidad de indexación a otros formatos, mediante llamadas a terceros programas.

En definitiva, que si quisiera encontrar un documento, tendría dos caminos para encontrarlo. El primero sería ubicarme en la carpeta del tema que trate, y el segundo, sería hacer uso del buscador de Xapian, y buscar algún término relacionado.

Por supuesto, este sistema puede complicarse todo lo que queramos, desde usar la versión completa de la C.D.U, hasta dejarnos las pestañas frente al ordenador rellenando los metadatos de los PDF, ePub, MP3 (id3 tags) y similares, usando las utilidades correspondientes. Personalmente opino que este sistema que os cuento ofrece un buen equilibrio y, aunque al principio nos pide invertir unas cuantas horas en clasificar los archivos, no requiere mucho esfuerzo, es flexible, y crece a medida de nuestras necesidades, pudiéndose complicar todo lo que nuestras ganas o el tiempo disponible nos permitan.

Por cierto, ¡se me olvidaba! No penseis que este sistema solo es para documentos de texto. La C.D.U también está pensada para clasificar material digital como música, películas, etc (¿hace cuando tiempo que no te pasas por la biblioteca municipal? ;-)):

75 Pintura.
76 Artes gráficas. Grabados.
77 Fotografía.
78 Música. Géneros musicales. Métodos y estudios de Música para los distintos instrumentos.
79 Diversiones. Juegos. Deportes. Espectáculos públicos.
791.4 Cine.
792 Teatro. Teoría y técnica teatral.

En fin, como veis no os mentía cuando os decía que este sistema es muy versátil. No deja de ser la típica clasificación por carpetas, combinada con un búscador de archivos, pero a mí me parece una solución muy válida para tener organizada mi archivo personal.

¿Y vosotros, como haceis para organizar este cada vez mayor caudal de información que os llega a través del ordenador?

Fuente de la primera imagen : lahojadelabiblioteca.blogspot.com.es

Cincinnati's cavernous old main library

Comentarios

Enviado por María Fernanda (no verificado) en

Hola. Quisiera saber si finalmente hiciste la implementación de Xapian. 

Tengo una gran cantidad de documentos que quiero indexar para posteriores búsquedas, pero los ejemplos que encuentro de Xapian son sobre como indexar archivos .csv (que dentro de sí continene una estructura al estilo base de datos). 

Tienes ejemplos de indexamiento de archivos pdf y word, que contienen solo texto ?

Gracias

Enviado por Sandor en

Hola María. Desgraciadamente la implementación de Xapian se me ha ido quedando relegada ahí abajo en mi lista de cosas pendientes, así que por ahora sigo sin hacer nada.

He mirado un poco por encima la documentación y para indexar PDFs necesitarías la aplicación pdftotext (que en Linux viene con los paquetes poppler o xpdf). Para indexar documentos Word, necesitarás tener instalado el paquete antiword. Más información sobre los diferentes parsers que necesitas, en función de los tipos de archivo que quieras indexar, en esta dirección: http://xapian.org/docs/omega/overview.html

Ya siento no poder serte de más utilidad. Un saludo y gracias por comentar.

Enviado por MalkaviaN404 (no verificado) en

 Interesante, hoy e aprendido algo nuevo, y valla que me va a ser de utilidad.

 Siento que la implementacion del buscador, seria; Para cuando vas de prisa buscando algo muuy en especifico o cuando vagamente recuerdas el contenido de algo.

Añadir nuevo comentario

HTML Filtrado

  • Etiquetas HTML permitidas: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de las páginas web y las de correo se convierten en enlaces automáticamente.
CAPTCHA
Contesta a esta pregunta para comprobar que eres humano :-)
Fill in the blank.

Sobre PlanetaInopia

Sandor Inopia nació en Bilbao, un lunes cualquiera, justo 1904 años después de que Nerón se suicidara, diciendo ¡Qué artista muere conmigo!, y 192 años después de que Volta descubriera la pila eléctrica. Mientras celebraba su quinto cumpleaños, Elvis daba su último concierto, y celebrando los siete, Muhammad Ali se retiraba del boxeo.

Sobre PlanetaInoipa, blog personal de Sandor Inopia (Sandor Saiz Ortuondo)

Yo no tengo la ambición de Nerón, la inteligencia de Volta, la voz de Elvis, o la fuerza de Alí, pero a veces me gusta escribir y darme a conocer a los demás. Por eso este blog, que espero te guste.

Comentarios recientes