Una Corta Historia del eBook by Marie Lebert - HTML preview

PLEASE NOTE: This is an HTML preview only and some elements such as links or page numbers may be incorrect.
Download the book in PDF, ePub, Kindle for a complete version.

1998: LAS BIBLIOTECAS SE INSTALAN EN LA WEB

= [Resumen]

A partir de 1998, muchas bibliotecas "tradicionales" crean su propiositio web, que se convierte en

"escaparate virtual" y les permiteproponer su catálogo, información práctica y una selección de otrossitios web para evitar a sus lectores la molestia de perderse en lared. Estas bibliotecas proponen también bibliotecas digitales para dara conocer sus colecciones a un público amplio: colecciones de textos,colecciones de imágenes (fijas o animadas) y colecciones sonoras. Lasbibliotecas digitales se desarrollan rápidamente y proporcionan accesofacil a documentos que hasta entonces eran difíciles o casi imposiblesde consultar, por pertenecer a fondos antiguos, a fondos regionales o afondos especializados.

= Bibliotecas tradicionales

La primera biblioteca "tradicional" presente en el internet es laBiblioteca municipal de Helsinki (Finlandia) que inaugura su sitio weben febrero de 1994. Varias bibliotecas elaboran "ciberespacios" parasus lectores.

Otras dan a conocer las joyas de sus colecciones pormedio de la web. Algunas bibliotecas nacionales unen fuerzas para crearun portal común.

Frente a una web enciclopédica y a la proliferación de las bibliotecasdigitales, ¿tendrán las bibliotecas tradicionales los días contados?¿Será la biblioteca digital una verdadera amenaza para la existencia dela biblioteca tradicional? Éstas son las preguntas que se plantean en1998. En esta fecha, varias grandes bibliotecas explican en su sitioweb que a pesar de que el sector digital esté en plena expansión, lacomunicación física de los documentos sigue siendo esencial. Acontinuación estos comentarios desaparecen. A principios de los años2000, casi todas las bibliotecas tradicionales disponen de coleccionesdigitales, sea para uso interno, sea en libre acceso en la web. Sedigitalizan los documentos para evitar tener que manipularlos después,y de este modo cualquier usuario puede acceder fácilmente a ellos.

La razón de ser de las bibliotecas nacionales es preservar unpatrimonio acumulado a lo largo de los siglos: manuscritos, incunables,libros impresos, diarios, periódicos, grabados, carteles, partiturasmusicales, imágenes, fotos, películas, etc. Esto no va a cambiarpronto, a pesar de que la tecnología digital ocupe un lugar cada vezmás importante en el mundo del libro y de los demás soportes. Aunqueesta omnipresencia de los soportes digitales favorezca la comunicación,sigue siendo necesario encontrar un lugar donde almacenar losdocumentos físicos originales, empezando por las Biblias de Gutenberg.

Las bibliotecas nacionales archivan también los documentos electrónicosy los sitios web. En la Biblioteca nacional de Francia (BnF) porejemplo, han decidido recoger y archivar los sitios web cuyo nombre dedominio termine con ".fr", y también los sitios dedicados a lascampañas electorales, primero para las elecciones presidenciales de2002, luego para las legislativas de 2004, y finalmente para laspresidenciales y las legislativas de 2007, recogiendo y archivando lossitios institucionales, los sitios y blogs oficiales de los candidatos,los sitios de los medios de comunicación, los sitios de asociaciones yde sindicatos, etc.

Las bibliotecas públicas tampoco parecen estar en peligro dedesaparecer. A pesar de la curiosidad suscitada por el libro digital,los lectores aseguran con frecuencia en diversos sondeos que no estándispuestos a leer a Zola o a Proust en pantalla. Una cuestión degeneración, quizás. Tal vez los niños que hayan aprendido a leerdirectamente en la pantalla no tengan ningún problema a la hora de leerlibros online en soportes electrónicos de todo tipo.

Si bien las bibliotecas nacionales y las bibliotecas públicas siguensiendo útiles, la situación de las bibliotecas especializadas esdiferente. En muchos campos del saber, en los que prevalece lainformación más reciente, se plantean actualmente preguntas sobre lanecesidad de colocar documentos impresos en unos estantes, cuando esmucho más práctico reunir, almacenar, archivar, organizar, catalogar ydifundir documentos electrónicos, e imprimirlos sólo a petición de losusuarios.

Pierre Perroud, fundador de la biblioteca digital Athena, insiste en lacomplementariedad del texto electrónico y del libro impreso. En suopinión, "los textos electrónicos representan una incitación a lalectura y una participación atrayente a la difusión de la cultura",especialmente respecto al estudio y a la búsqueda textual. Estos textos"son un buen complemento del libro impreso – aunque este último seairremplazable si se trata de leerlo". Aunque esté convencido de lautilidad del texto electrónico, sigue pensando que el libro impreso aúnes "un compañero misteriosamente sagrado hacia el cual convergensímbolos profundos: uno puede apretarlo en su mano, estrecharlo contrasu pecho, mirarlo con admiración; su pequeñez nos tranquiliza tantocomo nos impresiona su contenido; su fragilidad esconde una densidadque nos tiene fascinados; como el hombre, teme el agua y el fuego, peroes capaz de mantener al pensamiento humano a salvo del Tiempo."(fragmento de la revista Informatique-Informations, Ginebra, febrero de1997)

= Bibliotecas digitales

La difusión del libro, un objetivo perseguido por varias generacionesde bibliotecarios, por fin se hace posible a gran escala, ya que hoy endía éste puede ser convertido en archivo electrónico y transitar vía elinternet para alcanzar a un público que no siempre tiene acceso a unabiblioteca tradicional.

Si bien algunas bibliotecas digitales nacen directamente en la web, lamayoría emana de bibliotecas tradicionales. En 1996, la Bibliotecamunicipal de Lisieux (Normandía, Francia) lanza la Bibliotecaelectrónica de Lisieux, que ofrece las versiones digitales de obrasliterarias cortas elegidas entre las colecciones municipales. En 1997,la Biblioteca nacional de Francia (BnF) crea el sitio web Gallica, quepropone, en una primera fase, imágenes y textos del siglo XIX en lenguafrancesa, con una selección de 3.000 libros y una muestra de la futuraiconoteca digital. En 1998, la Biblioteca municipal de Lyon pone lasiluminaciones y miniaturas de 200 manuscritos e incunables adisposición de todos en su sitio web. Y

estos no son más que tresejemplos entre otros tantos.

Las bibliotecas digitales permiten a un amplio público tener acceso adocumentos difíciles de consultar en fondos antiguos, locales,regionales o especializados, poco accesibles por diversos motivos: afánde conservar documentos raros y frágiles, horarios, formulariosmúltiples para rellenar, plazos de comunicación largos, penuria depersonal.

Gracias a la biblioteca digital, la biblioteca tradicional por finpuede reconciliar dos objetivos que hasta ahora no eran compatibles, asaber la conservación de los documentos y la comunicación de losmismos. De esta manera nadie saca el documento del estante más que enuna sola ocasión: para escanearlo, y además el público por fin puedeacceder a su contenido. Si el lector desea aún consultar el documentooriginal, quedará libre de hacerlo, pero sabrá de antemano si elcontenido le interesa o no, gracias al "hojeo" previo en pantalla.

Según la British Library, pionera en este campo, la biblioteca digitalpuede definirse como una entidad que emana del uso de las tecnologíasdigitales para adquirir, almacenar, preservar y difundir documentos. Obien se publican estos documentos directamente bajo forma digital, obien se digitalizan a partir de un documento impreso, audiovisual ogenerado a partir de otro soporte. Se considera que una coleccióndigital constituye una biblioteca digital cuando cumpla con los cuatrocriterios siguientes: 1) puede ser creada y/o producida en distintoslugares, pero se accede a ella en calidad de entidad única; 2) debeestar organizada e indexada de tal manera que el acceso al servidorresulte lo más fácil posible; 3) se debe almacenar y administrar demanera que pueda perdurar bastante tiempo tras su creación; 4) debeencontrar un equilibrio entre el respeto de los derechos de autor y lasexigencias universitarias.

Hospedada por la Universidad Carnegie Mellon (Estados Unidos), laUniversal Library realza las tres ventajas de la biblioteca digital:1) ocupa menos espacio que una biblioteca tradicional y su contenidopuede ser copiado o guardado electrónicamente; 2) cualquier personapuede acceder inmediatamente a su contenido en el internet; 3) el hechode que cualquier búsqueda de contenido esté automatizada permite a lavez reducir significativamente los costes de funcionamiento eincrementar la accesibilidad de los documentos.

A título histórico, el sitio web Library 2000 presenta un compendio delas investigaciones realizadas entre octubre de 1995 y octubre de 1997por el MIT/LCS (Massachusetts Institute of Technology / Laboratory ofComputer Science). Library 2000 es un proyecto pragmático, que sepropone estudiar durante dos años los problemas planteados por elalmacenamiento en línea de una inmensa cantidad de documentos.Desarrolla un prototipo que podría ser económicamente viable en el año2000. Gracias a este prototipo se ponen en línea varias bibliotecasdigitales de grandes dimensiones a partir de noviembre de 1997.

Para las imágenes, los problemas con el ancho de banda vandesapareciendo. Primero las bibliotecas optaron a menudo por imágenesde página entera, muy agradables visualmente, pero que tardabandemasiado en aparecer en pantalla. Deciden entonces presentar imágenesen formato reducido, con posibilidad de hacer clic en ellas paraobtener un formato más grande. Esta presentación es la que se haestablecido luego como norma, incluso después de que se generalizara elinternet de banda ancha. Ahora el paso de un formato pequeño a unformato grande resulta muy rápido – o incluso inmediato –, a gransatisfacción de los iconógrafos, de los fotógrafos y demás consumidoresde imágenes.

= Digitalización: modo texto o modo gráfico

No sé puede hablar de biblioteca digital sin hablar de digitalización.Para que un libro pueda ser consultado en pantalla, primero hace faltadigitalizarlo, en modo texto o en modo imagen.

La digitalización en modo texto implica la necesidad de dactilografiarel texto. Consiste en digitar el libro con paciencia en el teclado,página a página. Ésta era la solución que se solía adoptar alconstituirse las primeras bibliotecas digitales, o bien cuando losdocumentos originales carecían de claridad, por ejemplo en el caso delos libros antiguos. Han pasado varios años, y para digitalizar en modotexto ya casi basta con escanear el libro en modo imagen, y luego enconvertirlo en texto gracias a un software OCR (optical characterrecognition). Se supone que un buen software OCR tiene una fiabilidadde un 90%, luego basta con una relectura en pantalla para corregir eltexto.

En este caso, la versión informática del libro no conserva el diseñooriginal de este libro, ni tampoco el de la página. El libro seconvierte en texto, es decir en un conjunto de caracteres que aparecende continuo en la pantalla. A causa de la cantidad de tiempo que senecesita para procesar cada libro, este modo de digitalización resultabastante largo, y por lo tanto es más costoso que la digitalización enmodo imagen. A pesar de todo, es muy preferible el modo texto, ya quepermite la indexación, la búsqueda y el análisis textual, así comoestudios comparativos entre varios textos o varias versiones del mismotexto. Éste es el método utilizado por ejemplo por el ProyectoGutenberg, fundado en 1971, y también por la Biblioteca electrónica deLisieux (Normandía, Francia), creada en 1996.

Digitalizar en modo imagen equivale a fotografiar el libro página apágina. La versión informática no es sino un facsímil digital de laversión impresa. Como se conserva la presentación original, luego esposible

"hojear" el texto en pantalla, página a página. Éste es elmétodo empleado para digitalizaciones a gran escala, por ejemplo parala biblioteca digital Gallica de la Biblioteca nacional de Francia(BnF). Sin embargo, para la tabla de contenidos, los sumarios y loscorpus de documentos iconográficos se utiliza la digitalización en modotexto, a fin de facilitar la búsqueda textual.

¿Por qué no se digitaliza todo en modo texto? La BnF contesta estapregunta en 2000 en el sitio web de Gallica: "El modo imagen permiteconservar el aspecto inicial del documento original, e incluso loselementos no textuales. En cuanto al modo texto, permite efectuarbúsquedas más amplias y precisas en un documento, y reducirsubstancialmente el volumen de los archivos tratados, pero supone uncoste de procesamiento más o menos diez veces superior al de una simpledigitalización en modo imagen, bien se trate de teclear el texto o deutilizar un software OCR. Se pueden utilizar estas técnicas si elvolumen es limitado, pero no podría justificarse a nivel económicotratándose de los 50.000 documentos (o sea casi 15

millones de páginas)que se han puesto en línea."

Pierre Schweitzer, el diseñador del software Mot@mot – que sirve parareorganizar el diseño de los facsímiles digitales – insiste sobre lautilidad de ambos modos de digitalización. "El modo imagen permitedigitalizar deprisa y con costes muy reducidos, explica en enero de2001. Esto es importante porque la tarea de digitalización del dominopúblico es inmensa. Hay que tomar en cuenta también las diferentesediciones: si se digitaliza el patrimonio, es para facilitar el accesoa las obras. Por lo tanto sería paradójico focalizarse en una solaedición, dejando de lado el acceso a las otras ediciones. Cada uno delos dos modos de digitalización conviene a un tipo de documentos,antiguo/frágil o reciente, libre o no de derechos (para el autor o parala edición), parca o abundantemente ilustrado. Los dos métodos tambiéntienen estatutos bastante distintos: en modo texto puede tratarse de lanueva edición de una obra, mientras que en modo imagen se trata másbien de una 'edición de otra edición'. En la práctica, la eleccióndepende del tipo de fondo que se quiere digitalizar, del presupuestodisponible y de los objetivos que hay que alcanzar. Sería difícilprescindir de una de las dos técnicas."

# Gallica

Gallica, la biblioteca digital de la Biblioteca nacional de Francia(BnF: Bibliothèque nationale de France), se inauguró en octubre de 1997con la digitalización de imágenes y textos del siglo XIX francófono,"el siglo de la edición y de la prensa moderna, el siglo de la novela ytambién el de las grandes síntesis históricas y filosóficas, un siglocientífico y técnico".

Al principio del proyecto, el servidor almacenaba por una parte2.500 libros digitalizados en modo imagen, y por otra los 250 libros enmodo texto de la base Frantext del Instituto nacional de la lenguafrancesa (INaLF: Institut national de la langue française).Clasificados por disciplina, estos libros se acompañan de unacronología del siglo XIX y de algunas síntesis sobre las grandescorrientes en historia, ciencias políticas, derecho, economía,literatura, filosofía, ciencias e historia de las ciencias.

El sitio web propone también una muestra de la futura iconotecadigital, es decir el fondo del fotógrafo Eugène Atget, una selección dedocumentos sobre el escritor Pierre Loti, una colección de imágenes dela Escuela nacional de ingeniería civil (Ecole nationale des Ponts etChaussées) que representan las grandes obras vinculadas con larevolución industrial en Francia, y por último una selección de librosilustrados sacados de la Biblioteca del Museo del Hombre (Musée del’Homme) de París, un museo de antropología.

A finales de 1997, Gallica se considera más un "laboratorio que sepropone evaluar las condiciones de acceso y de consulta a distancia delos documentos digitales" que un simple banco de datos digitalizados.El objetivo es experimentar la navegación en estas colecciones,permitiendo a cualquier usuario saciar su curiosidad libremente, orealizar búsquedas textuales especializadas.

A inicios de 1998, Gallica anuncia 100.000 volúmenes y 300.000 imágenespara finales de 1999, y una amplificación rápida de las colecciones acontinuación. De los 100.000 volúmenes previstos – o sea un total de 30millones de páginas digitalizadas – más de un tercio concierne el sigloXIX. En cuanto a las 300.000

imágenes fijas, la mitad pertenece adepartamentos especializados de la BnF (Estampas y fotografía,Manuscritos, Artes del espectáculo, Monedas y medallas, etc.).La otra mitad proviene de las colecciones de establecimientos públicos- varios museos y bibliotecas, la Documentation française (unaeditorial pública), la Escuela nacional de ingeniería civil (Ecolenationale des Ponts et Chaussées), el Instituto Pasteur, elObservatorio de París, etc. - y de establecimientos privados - agenciasde prensa entre las cuales Magnum, Agence France-Presse, Sygma, Rapho,etc.

En mayo de 1998, la BnF revisa a la baja sus expectativas para Gallicay modifica un poco sus primeras orientaciones. Jérôme Strazzulla,periodista del diario Le Figaro, explica en la edición del 3 de juniode 1998

que la BnF "ha pasado de un proyecto universalista yenciclopédico, a la necesidad de elegir orientaciones precisas". En elmismo artículo, el presidente de la BnF, Jean-Pierre Angremy, comunicala decisión del comité editorial de Gallica: "Hemos decidido abandonarla idea de un vasto corpus enciclopédico de cien mil libros, al quesiempre se le podría reprochar algunas omisiones. Ahora nos orientamoshacia corpus temáticos, lo más completos posible, pero másrestringidos. (…) Lo que buscamos es satisfacer en prioridad lassolicitudes de los investigadores y lectores."

El primer corpus, cuya puesta en línea está prevista para el año 2000,tendrá que ver con el tema de los viajes por Francia. Reunirá textos,estampas y fotografías del siglo XVI hasta 1920. A continuación, loscorpus se organizarán en torno a los temas siguientes: París, losviajes a África desde los orígenes hasta 1920, las utopías, y lasmemorias de las Academias de ciencias de ciudades francesas.

En 2003, Gallica reúne 70.000 obras y 80.000 imágenes que cubren desdela Edad Media hasta el principio del siglo XX, incluyendo sólodocumentos libres de derechos. Sin embargo, muchos usuarios opinan quelos archivos son muy pesados ya que los libros se han digitalizado enmodo imagen, y resulta muy largo acceder a su contenido. Otro problemaimportante es que la digitalización en modo imagen no permite realizarbúsquedas textuales, a pesar de que Gallica sea la biblioteca digitalfrancófona más amplia de la red en cuanto a la cantidad de títulosdisponibles en línea. Sólo una pequeña colección de libros (1.117libros en febrero de 2004) se ha digitalizado en modo texto, los de labase Frantext.

En febrero de 2005, Gallica cuenta con 76.000 obras. En la misma fecha,la BnF anuncia que pronto se pondrá en línea (entre 2006 y 2009) laprensa francesa publicada entre 1826 y 1944, o sea 22 títulos, con untotal de 3,5 millones de páginas. A principios de 2006, los primerosperiódicos disponibles en línea son los diarios Le Figaro (fundado en1826), La Croix (fundada en 1883), L'Humanité (fundada en 1904) y LeTemps (fundado en 1861 y desaparecido en 1942).

En diciembre de 2006, las colecciones abarcan 90.000 obrasdigitalizadas (incluso fascículos de prensa), 80.000 imágenes y decenasde horas de recursos sonoros. Gallica empieza la conversión en modotexto de los libros - que primero habían sido digitalizados en modoimagen - con el fin de facilitar el acceso a su contenido así como suindexación en los buscadores.

En noviembre de 2007, Gallica anuncia que se han de digitalizar 300.000obras adicionales de aquí a 2010.

Éstas estarán accesibles en su nuevositio web Gallica2, en modo imagen y en modo texto a la vez, lo que entotal representa 45 millones de páginas.