Copyright © 2010 Marie Lebert

—-A trilingual ebook to celebratethe 40 years (1971-2011)of Project Gutenberg,born on July 4, 1971,with celebrationsduring the whole year 2011.

—-Un ebook trilingüe para celebrarlos 40 años (1971-2011)del Proyecto Gutenberg,nacido el 4 de julio de 1971,con celebracionesdurante todo el año 2011.

—-Un ebook trilingue pour célébrerles 40 ans (1971-2011)du Projet Gutenberg,né le 4 juillet 1971,avec des célébrationspendant toute l'année 2011.



[en] Overview[es] Sumario[fr] Sommaire

[en] Project Gutenberg is 40 years old[es] El Proyecto Gutenberg tiene 40 años[fr] Le Projet Gutenberg a 40 ans

[en] From the past to the future[es] Desde el pasado hacia el futuro[fr] Du passé vers l'avenir

[en] Project Gutenberg and languages[es] El Proyecto Gutenberg y los idiomas[fr] Le Projet Gutenberg et les langues

[en] Distributed Proofreaders is 10 years old[es] Distributed Proofreaders tiene 10 años[fr] Distributed Proofreaders a 10 ans

[en] Acknowledgements[es] Agradecimientos[fr] Remerciements OVERVIEW [EN]

The first ebook was available on July 4, 1971, as eText #1 of ProjectGutenberg, a visionary project launched by Michael Hart to create freeelectronic versions of literary works and disseminate them worldwide.In the 16th century, Gutenberg allowed anyone to have print books for asmall cost. In the 21st century, Project Gutenberg would allow anyoneto have a digital library at no cost. Project Gutenberg got its firstboost with the invention of the web in 1990, and its second boost withthe creation of Distributed Proofreaders in 2000, to share theproofreading of ebooks between hundreds of volunteers. In 2010, ProjectGutenberg offered more than 33,000 high-quality ebooks being downloadedby the tens of thousands every day, and websites in the United States,in Australia, in Europe, and in Canada, with 40 mirror sites worldwide.

This trilingual (English, Spanish, French) ebook is meant to celebratethe 40th anniversary of Project Gutenberg, with four parts:# Project Gutenberg is 40 years old# From the past to the future# Project Gutenberg and languages# Distributed Proofreaders is 10 years old About the author > Marie Lebert is a researcher and journalistspecializing in technology for books and languages. Her books arefreely available in Project Gutenberg <> and <>, in various formats for anyelectronic device (computer, PDA, mobile phone, smartphone, ebookreader).


El primer libro digital remonta al 4 de julio de 1971. Se trata deleText #1 del Proyecto Gutenberg, un proyecto visionario lanzado porMichael Hart con el fin de crear versiones electrónicas gratuitas deobras literarias y de difundirlas por el mundo entero. En el siglo 16,Gutenberg había hecho posible para todos tener libros impresos por unprecio relativamente módico. En el siglo 21, el Proyecto Gutenberg ibaa permitir a cada uno disponer de una biblioteca digital gratuita. Esteproyecto cobra nuevo aliento y alcanzó una difusión internacional conla aparición de la web en 1990, y luego con la creación de DistributedProofreaders en 2000, cuya meta es compartir la revisión de los librosentre centenares de voluntarios. En 2010, el Proyecto Gutenberg cuentacon más de 33.000 ebooks de alta calidad y decenas de milles dedescargas al día. Tiene sitios web en los Estados Unidos, en Australia,en Europa y en Canadá, con 40 sitios espejo repartidos por todo elplaneta.

Este ebook trilingüe (inglés, español, francés) tiene como metacelebrar los 40 años del Proyecto Gutenberg, con quatro partes:# El Proyecto Gutenberg tiene 40 años# Desde el pasado hacia el futuro# El Proyecto Gutenberg y los idiomas# Distributed Proofreaders tiene 10 años Sobre la autora > Marie Lebert, investigadora y periodista, se interesapor las tecnologías para el libro y los idiomas. Sus libros estándisponibles gratuitamente en el Proyecto Gutenberg <>y en <>, en varios formatos paralectura en un ordenador, un PDA, un teléfono móvil, un smartphone o unatableta. Muchas gracias a Anna Álvarez por su ayuda para varios textosen español.


Le premier livre numérique date du 4 juillet 1971. Il s'agit de l'eText#1 du Projet Gutenberg, un projet visionnaire lancé par Michael Hartpour créer des versions électroniques gratuites d'oeuvres littéraireset les diffuser dans le monde entier. Au 16e siècle, Gutenberg avaitpermis à chacun d'avoir des livres imprimés pour un prix relativementmodique. Au 21e siècle, le Projet Gutenberg permettrait à chacund'avoir une bibliothèque numérique gratuite. Ce projet trouve un secondsouffle et un rayonnement international avec l'apparition du web en1990, puis la création de Distributed Proofreaders en 2000 pourpartager la relecture des livres entre des centaines de volontaires. En2010, le Projet Gutenberg compte plus de 33.000 ebooks de grandequalité ainsi que des dizaines de milliers de téléchargements par jour.Il dispose de sites web aux États-Unis, en Australie, en Europe et auCanada, avec 40 sites miroirs répartis sur toute la planète.

Cet ebook trilingue (anglais, espagnol, français) a pour but decélébrer les 40 ans du Projet Gutenberg, avec quatre parties:# Le Projet Gutenberg a 40 ans# Du passé vers l'avenir# Le Projet Gutenberg et les langues#

Distributed Proofreaders a 10 ans

Au sujet de l'auteure > Marie Lebert, chercheuse et journaliste,s'intéresse aux technologies pour le livre et les langues. Ses livressont librement disponibles dans le Projet Gutenberg <>et dans <>, dans divers formatspermettant leur lecture sur tout appareil électronique (ordinateur,PDA, téléphone mobile, smartphone et tablette).


In the 16th century, Gutenberg allowed anyone to have print books for asmall cost. In the 21st century, Project Gutenberg would allow anyoneto have a digital library at no cost.

# Beginning

As recalled by Michael Hart in January 2009 in an email interview: ―OnJuly 4, 1971, while still a freshman at the University of Illinois(UI), I decided to spend the night at the Xerox Sigma V mainframe atthe UI Materials Research Lab, rather than walk miles home in thesummer heat, only to come back hours later to start another day ofschool. I stopped on the way to do a little grocery shopping to getthrough the night, and day, and along with the groceries they put inthe faux parchment copy of The U.S. Declaration of Independence thatbecame quite literally the cornerstone of Project Gutenberg. Thatnight, as it turned out, I received my first computer account – I hadbeen hitchhiking on my brother‘s best friend‘s name, who ran thecomputer on the night shift. When I got a first look at the huge amountof computer money I was given, I decided I had to do somethingextremely worthwhile to do justice to what I had been given. This wassuch a serious, and intense thought process for a college freshman, myfirst thought was that I had better eat something to get up enoughenergy to think of something worthwhile enough to repay the cost of allthat computer time. As I emptied out groceries, the faux parchmentDeclaration of Independence fell out, and the light literally went onover my head like in the cartoons and comics… I knew what the futureof computing, and the internet, was going to be… ‗The InformationAge.‘ The rest, as they say, is history.‖

Michael keyed in The United States Declaration of Independence to themainframe he was using, in upper case, because there was no lower caseyet. The file was 5 K. To send a 5 K file to the 100 users of the pre-internet of the time would have crashed the network, so Michaelmentioned where the etext was stored -

though without a hypertext link,because the web was still 20 years ahead. It was downloaded by sixusers.

Project Gutenberg was born.

Michael decided to use the huge amount of computer time he had beengiven to search the literary works that were stored in libraries, andto digitize these works. A book would become a continuous text fileinstead of a set of pages. Project Gutenberg‘s mission would be thefollowing: to put at everyone‘s disposal, in electronic versions, asmany literary works as possible for free.

After keying in The United States Declaration of Independence (signedon July 4, 1776) in 1971, Michael typed in a longer text, The UnitedStates Bill of Rights, in 1972, i.e. the first ten amendments added in1789

to the Constitution (dated 1787) and defining the individualrights of the citizens and the distinct powers of the federalgovernment and the States. A volunteer typed in The United StatesConstitution in 1973.

From one year to the next, disk space was getting larger, by thestandards of the time – there was no hard disk yet -, making itpossible to store larger files.

Volunteers began typing in The Bible, with one individual book at atime, and a file for each book.

Michael typed in the collected works of Shakespeare, with volunteers,one play at a time, and a file for each play. This edition ofShakespeare was never released, unfortunately, due to changes incopyright law.

Shakespeare‘s works belong to public domain, butcomments and notes may be copyrighted, depending on the publicationdate. Other editions of Shakespeare from public domain were released afew years later.

# 10 to 1,000 ebooks

Its critics long considered Project Gutenberg as impossible on a largescale. But Michael went on keying book after book during many years,with the help of some volunteers.

In August 1989, Project Gutenberg completed its 10th ebook, The KingJames Bible (1769), both testaments, and 5M for all files.

In 1990, there were 250,000 internet users. The web was in its infancy.

The standard was 360 K disks.

In January 1991, Michael typed in Alice‘s Adventures in Wonderland(1865), by Lewis Carroll. In July 1991, he typed in Peter Pan (1904),by James M. Barrie. These two classics of childhood literature each fiton one disk.

The first browser, Mosaic, was released in November 1993. It becameeasier to circulate etexts and recruit volunteers. From 1991 to 1996,the number of ebooks doubled every year, with one ebook per month in1991, two ebooks per month in 1992, four ebooks per month in 1993, andeight ebooks per month in 1994.

In January 1994, Project Gutenberg released The Complete Works ofWilliam Shakespeare as eBook #100.

Shakespeare wrote most of his worksbetween 1590 and 1613.

The steady growth went on, with an average of 8 ebooks per month in1994, 16 ebooks per month in 1995, and 32 ebooks per month in 1996.

In June 1997, Project Gutenberg released The Merry Adventures of Robin Hood (1883), by Howard Pyle.

Project Gutenberg reached 1,000 ebooks in August 1997. EBook #1000 wasLa Divina Commedia (1321), by Dante Alighieri, in Italian, its originallanguage.

With the number of ebooks on the rise, three main sections were set up:(a) ―Light Literature‖, such as Alice‘s Adventures in Wonderland,Through the Looking-Glass, Peter Pan and Aesop‘s Fables; (b)

―HeavyLiterature‖, such as the Bible, Shakespeare‘s works, Moby Dick andParadise Lost; (c) ―Reference Literature‖, such as Roget‘s Thesaurus,almanacs, and a set of encyclopedias and dictionaries. (A more detailedclassification was created later on.)

―Light Literature‖ was the main section in number of ebooks. Asexplained on the website in 1998: ―The Light Literature Collection isdesigned to get persons to the computer in the first place, whether theperson may be a pre-schooler or a great-grandparent. We love it when wehear about kids or grandparents taking each other to an etext of PeterPan when they come back from watching Hook at the movies, or when theyread Alice in Wonderland after seeing it on TV. We have also been toldthat nearly every Star Trek movie has quoted current Project Gutenbergetext releases (from Moby Dick in The Wrath of Khan; a Peter Pan quotefinishing up the most recent, etc.) not to mention a reference toThrough the Looking-Glass in JFK. This was a primary concern when wechose the books for our libraries. We want people to be able to look upquotations they heard in conversation, movies, music, other books,easily with a library containing all these quotations in an easy-to-find etext format.‖

Project Gutenberg's goal is more about selecting books intended for thegeneral public than providing authoritative editions. As explained onthe website in 1998: ―We do not write for the reader who cares whethera certain phrase in Shakespeare has a ‗:‘ or a ‗;‘ between its clauses.We put our sights on a goal to release etexts that are 99.9% accuratein the eyes of the general reader. Given the preferences ourproofreaders have, and the general lack of reading ability the publicis currently reported to have, we probably exceed those requirements bya significant amount. However, for the person who wants an‗authoritative edition‘ we will have to wait some time until thisbecomes more feasible. We do, however, intend to release many editionsof Shakespeare and the other classics for comparative study on ascholarly level.‖

The etexts, later called ebooks, were stored in the simplest way, usingthe low set of ASCII, called Plain Vanilla ASCII, for them to be readon any hardware and software. As a text file, a book could be easilycopied, indexed, searched, analyzed, and compared with other books.

As explained by Michael Hart in August 1998 in an email interview: ―Weconsider etext to be a new medium, with no real relationship to paper,other than presenting the same material, but I don‘t see how paper canpossibly compete once people each find their own comfortable way toetexts, especially in schools. (…) My own personal goal is to put10,000 etexts on the net [this goal was reached in October 2003] and ifI can get some major support, I would like to expand that to 1,000,000and to also expand our potential audience for the average etext from1.x% of the world population to over 10%, thus changing our goal fromgiving away 1,000,000,000,000 etexts to 1,000 times as many, a trillionand a quadrillion in U.S.


# 1,000 to 10,000 ebooks

From 1998 to 2000, the ―output‖ was an average of 36 new ebooks permonth.

Project Gutenberg reached 2,000 ebooks in May 1999. EBook #2000 was DonQuijote (1605), by Cervantes, in Spanish, its original language.

Distributed Proofreaders was launched in October 2000 by Charles Franksto share the proofreading of ebooks between many volunteers. Volunteerschoose one of the digitized books available on the website andproofread a given page, or several pages, as they wish.

Project Gutenberg reached 3,000 ebooks in December 2000. EBook #3000was À l‘ombre des jeunes filles en fleurs (In the Shadow of Young Girlsin Flower), vol. 3 (1919), by Marcel Proust, in French, its originallanguage.

Project Gutenberg Australia was launched in August 2001.

Project Gutenberg reached 4,000 ebooks in October 2001. EBook #4000 wasThe French Immortals Series (1905), in English. This book is ananthology of short fictions by authors from the French Academy(Académie Française): Emile Souvestre, Pierre Loti, Hector Malot,Charles de Bernard, Alphonse Daudet, and others.

The output in 2001 was an average of 104 new ebooks per month.

Project Gutenberg reached 5,000 ebooks in April 2002. EBook #5000 wasThe Notebooks of Leonardo da Vinci, an English version of Leonardo'searly 16th-century writings in Italian. Since its release, this ebookhas constantly stayed in the Top 100 of downloaded ebooks.

In 1991, Michael Hart chose to type in Alice‘s Adventures in Wonderlandand Peter Pan because they would each fit on one 360 K disk, thestandard of the time. In 2002, the standard disk was 1.44 M and couldbe compressed as a zipped file.

A practical file size is about 3 million characters, more than longenough for the average book. The ASCII version of a 300-page novel is 1M. A bulky book can fit in two ASCII files, that can be downloaded asis or zipped. An average of 50 hours is necessary to get an ebookselected, copyright-cleared, scanned, proofread, formatted, andassembled.

A few numbers are reserved for ―special‖ books. For example, eBook#1984 is reserved for George Orwell‘s classic, published in 1949, andstill a long way from falling into public domain.

In spring 2002, Project Gutenberg‘s ebooks represented 25% of all thepublic domain works freely available on the web and listed in theInternet Public Library (IPL). The output in 2002 was an average of 203new ebooks per month.

In November 2002, Project Gutenberg released the 75 files of the HumanGenome Project, with files of dozens or hundreds of megabytes, shortlyafter its initial release in February 2001 as a work from publicdomain.

1,000 ebooks in August 1997, 2,000 ebooks in May 1999, 3,000 ebooks inDecember 2000, 4,000 ebooks in October 2001, 5,000 ebooks in April2002, 10,000 ebooks in October 2003. EBook #10000 was The Magna Carta,signed in 1215 and known as the first English constitutional text.

From April 2002 to October 2003, in 18 months, the collection of ebooksdoubled, going from 5,000 ebooks to 10,000 ebooks, with a monthlyaverage of 348 new ebooks in 2003. The fast growth was the work ofDistributed Proofreaders, a website launched in October 2000 to sharethe proofreading of ebooks between many volunteers.

EBooks were also copied on CDs and DVDs. As blank CDs and DVDs costnext to nothing, Project Gutenberg began burning and sending a free CDor DVD to anyone asking for it. People were encouraged to make copiesfor a friend, a library or a school. Released in August 2003, the Bestof Gutenberg CD

contained 600 ebooks. The first Project Gutenberg DVDwas released in December 2003 to celebrate the first 10,000 ebooks,with the burning of most titles (9,400 ebooks).

In September 2003, Project Gutenberg launched Project Gutenberg Audio eBooks, a collection of human-read ebooks, as well as the Sheet Music Subproject, a collection of digitized music sheet and music recordings.

A collection of still and moving pictures was also available.

# 10,000 to 20,000 ebooks

In December 2003, there were 11,000 ebooks, which represented 110 G, inseveral formats (ASCII, HTML, PDF, and others, as is or zipped). In May2004, there were 12,600 ebooks, which represented 135 G. With more than300 new ebooks added per month (338 ebooks per month in 2004), thenumber of gigabytes was expected to double every year.

The Project Gutenberg Consortia Center (PGCC) was affiliated withProject Gutenberg in 2003, and became an official Project Gutenbergsite. Since 1997, PGCC had been working on gathering collections ofexisting ebooks, as a complement to Project Gutenberg working onproducing ebooks. As explained by Michael Hart in February 2009: ―TheProject Gutenberg Consortia Center has over 75,000 ebooks rendered asPDF files, and some are really quite stunning. The difference? Thesefiles were prepared by other eLibraries, not Project Gutenberg, and areusing our worldwide distribution network to be seen.‖

In Europe, Project Rastko, based in Belgrade, Serbia, launched Project Gutenberg Europe (PG Europe) and Distributed Proofreaders Europe (DP

Europe) in January 2004. 100 ebooks were available in June 2005, in several languages, as a reflection of European linguistic diversity.

In January 2005, Project Gutenberg reached 15,000 ebooks. EBook #15000was The Life of Reason (1906), by George Santayana.

What about languages? There were ebooks in 25 languages in February2004, and in 42 languages in July 2005, including Sanskrit and theMayan languages. The seven main languages – with more than 50 ebooks

–were English (with 14,548 ebooks on July 27, 2005), French (577ebooks), German (349 ebooks), Finnish (218 ebooks), Dutch (130 ebooks),Spanish (103 ebooks), and Chinese (69 ebooks).

In July 2005, Project Gutenberg Australia (launched in August 2001)reached 500 ebooks.

Project Gutenberg PrePrints was launched in January 2006 to collectitems submitted to Project Gutenberg which were interesting enough tobe available online, but not ready yet to be added to the main ProjectGutenberg collection, because of missing data, low-quality files,formats which were not handy, etc.

379 ebooks were available inDecember 2006, and 2,020 ebooks in February 2009.

In December 2006, Project Gutenberg reached 20,000 ebooks. EBook #20000was the audiobook of Twenty Thousand Leagues Under the Sea (Vingt millelieues sous les mers, 1869), by Jules Verne, in its English version.

If 32 years and 3 months, from July 1971 to October 2003, werenecessary to produce the first 10,000

ebooks, 3 years and 2 months,from October 2003 to December 2006, were necessary to produce thefollowing 10,000 ebooks. There were ebooks in 50 languages in December2006.

# 20,000 to 30,000 ebooks

In December 2006, Mike Cook launched the blog Project Gutenberg News as―the news portal for‖, to complement the existing weeklyand monthly newsletters. For example, the blog gave a table of theweekly, monthly and yearly production numbers since 2001.

The weekly production was 24 ebooks in 2001, 47 ebooks in 2002, 79ebooks in 2003, 78 ebooks in 2004, 58 ebooks in 2005, and 80 ebooks in2006.

The monthly production was 104 ebooks in 2001, 203 ebooks in 2002, 348ebooks in 2003, 338 ebooks in 2004, 252 ebooks in 2005, and 345 ebooksin 2006.

The yearly production was 1,244 ebooks in 2001, 2,432 ebooks in 2002,4,176 ebooks in 2003, 4,058

ebooks in 2004, 3,019 ebooks in 2005, and4,141 ebooks in 2006.

Project Gutenberg Australia reached 1,500 ebooks in April 2007.

Project Gutenberg Canada (PGC) was launched on July 1st, 2007, on Canada Day, by Michael Shepard and David Jones. Distributed Proofreaders Canada (DPC) started production in December 2007. There were 100 ebooks in March 2008, in English, French, and Italian.

Project Gutenberg sent out 15 million ebooks via CDs and DVDs by snailmail in 2007. The latest DVD

(released in July 2006) included 17,000ebooks. CD and DVD files were also generated as ISO files (since 2005)to be downloaded for burning CDs or DVDs.

Project Gutenberg reached 25,000 books in April 2008. EBook #25000 wasEnglish Book Collectors (1902), by William Younger Fletcher.

Project Gutenberg reached 30,000 books in October 2009. EBook #30000was The Bird Book (1915), by Chester Albert Reed.

# 30,000 ebooks onwards

Distributed Proofreaders celebrated its 10th anniversary in October2010, with more than 18,000 books digitized and proofread during tenyears by thousands of volunteeers.

Project Gutenberg offered more than 33,000 high-quality proofreadebooks in December 2010, in various formats for any electronic device(computer, PDA, mobile phone, smartphone, and ebook reader).


En el siglo 16, Gutenberg había hecho posible para todos tener librosimpresos por un precio relativamente módico. En el siglo 21, elProyecto Gutenberg iba a permitir a cada uno disponer de una bibliotecadigital gratuita.

# Gestación

¿Cuáles son las raíces del proyecto? Cuando Michael Hart estudia en laUniversidad de Illinois (Estados Unidos), el laboratorio informático desu universidad le asigna millones de dólares de tiempo de ordenador.

El 4 de julio de 1971, día de la fiesta nacional, Michael digita TheUnited States Declaration of Independence (Declaración de independenciade los Estados Unidos), en mayúsculas, pues las letras minúsculas aúnno existan. El texto electrónico representa 5 K (kilobytes).

El envío de un archivo de 5 K a las cien personas que forman el pre-internet de la época haya acabado con el sistema, provocando suimplosión, porque el ancho de banda aún es ínfimo.

Michael difunde un mensaje que explica dónde se almacena el texto – aúnsin enlace hipertexto, pues habría que esperar unos 20 años más para laweb – y seis personas descargan este archivo.

Sobre la marcha, Michael decide dedicar ese enorme crédito de tiempo ala búsqueda de obras literarias disponibles en bibliotecas, y a ladigitalización de éstas. El conjunto de páginas encuadernadas, formatradicional del libro, iba a convertirse en un texto electrónico que sepuede desplegar de par en par.

Poco después, Michael define así la misión del Proyecto Gutenberg:poner a disposición de todos, por vía electrónica, el mayor númeroposible de obras literarias gratuitamente.

Tras haber digitado The United States Declaration of Independence(Declaración de independencia de los Estados Unidos, firmada el 4 dejulio de 1776) en 1971, Michael prosigue con sus esfuerzos en 1972digitando The United States Bill of Rights (Declaración de derechos delos Estados Unidos). Esa declaración incluye las diez primerasenmiendas añadidas en 1789 a la Constitución de los Estados Unidos(ratificada en 1787), y define los derechos individuales de losciudadanos y los poderes respectivos del gobierno federal y de losEstados. En 1973, un voluntario digita The United States Constitution(Constitución de losEstados Unidos) en su totalidad.

El internet, aún embrionario en 1971, despega verdaderamente en 1974,tras la creación del protocolo TCP/IP (Transmission Control Protocol /Internet Protocol).

Año tras año, la capacidad del disquete aumenta con regularidad – eldisco duro no existe aún – de modo que los archivos pueden ocupar cadavez más espacio. Algunos voluntarios se animan a digitalizar La Biblia,compuesta de varios libros, cada cual puede tratarse por separado yocupar un archivo diferente.

Michael también empieza a digitar la obra completa de Shakespeare, conla ayuda de voluntarios, una obra de teatro tras otra, cada una en unarchivo. De hecho aquella edición nunca se puede poner en línea, debidoa que, entre tanto, entra en vigor una ley de copyright más rigurosa,ya no destinada a proteger el texto de Shakespeare, pasado desde hacetiempo al dominio público, sino los comentarios y notas de aquellaedición.

Otras ediciones anotadas que sí han pasado al dominio públicose ponen en línea algunos años más tarde.

# De 10 a 1.000 ebooks

En agosto de 1989, el Proyecto Gutenberg pone en línea su décimo texto,The King James Bible, una biblia publicada por primera vez en 1611 ycuya versión más conocida es la de 1769. El conjunto de los archivosdel Antiguo Testamento y del Nuevo Testamento representa 5 M(megabytes).

En 1990, ya hay 250.000 internautas, y el modelo estándar vigente es eldisquete de 360 K (kilobytes).

En enero de 1991, Michael digita Alice‘s Adventures in Wonderland(Alicia en el país de las maravillas, 1865) de Lewis Carroll. En juliodel mismo año, digita Peter Pan (1904) de James M. Barrie. Cada uno deestos dos clásicos de la literatura infantil cabe en un disqueteestándar.

Luego llega la web, operativa a partir de 1991. El primer navegador,Mosaic, aparece en noviembre de 1993. Al generalizarse el acceso a lared, resulta más fácil hacer circular los textos electrónicos yreclutar voluntarios.

El Proyecto Gutenberg perfecciona su método de trabajo, y logradigitalizar un texto al mes en 1991, dos textos al mes en 1992, cuatrotextos al mes en 1993 y ocho textos al mes en 1994.

En enero de 1994, el Proyecto Gutenberg celebra su eBook #100 con lapuesta en línea de The Complete Works of William Shakespeare (La obracompleta de William Shakespeare). Shakespeare escribió la mayor partede su obra entre 1590 y 1613.

A continuación la producción sigue aumentando, con una media de 8ebooks al mes en 1994, 16 ebooks al mes en 1995 y 32 ebooks al mes en1996.

Entre 1991 y 1996, la producción se ha duplicado cada año. Mientrassigue con la digitalización de los libros, Michael coordina también apartir de entonces el trabajo de decenas de voluntarios.

En 1997, la producción sigue siendo de 32 ebooks al mes. En junio de1997, el Proyecto Gutenberg pone en línea The Merry Adventures of RobinHood (Las alegres aventuras de Robin Hood, 1883) de Howard Pyle.

Enagosto de 1997, se pone en línea el eBook #1000, La Divina Commedia (LaDivina Comedia, 1321) de Dante Alighieri, en su idioma original, elitaliano.

El Proyecto Gutenberg se articula en torno a tres grandes sectores: (a)―Light Literature‖(literatura de entretenimiento), que incluye porejemplo Alice‘s Adventures in Wonderland (Las aventuras de Alicia en elpaís de las maravillas), Peter Pan o Aesop‘s Fables (Las Fábulas deEsopo); (b) ―Heavy Literature‖

(literatura ―seria‖), que incluye porejemplo La Biblia, las obras de Shakespeare o Moby Dick; (c)

―ReferenceLiterature‖ (literatura de referencia), que reúne enciclopedias ydiccionarios, por ejemplo el Roget‘s Thesaurus. Más adelante, estapresentación en tres sectores es sustituida por una clasificacióndetallada con más secciones.

El Proyecto Gutenberg pretende ser universal, tanto a nivel de lasobras que selecciona como del público al que se dirige, ya que la metaes poner la literatura a disposición de todos, sin limitarse al públicohabitual de estudiantes y docentes.

El sector dedicado a la literatura de entretenimiento se propone atraerfrente a la pantalla a un público muy diverso, por ejemplo a niños y asus abuelos en busca del texto electrónico de Peter Pan después dehaber visto la película Hook, de la versión electrónica de Alicia en elpaís de las maravillas tras haber visto una adaptación televisiva, odel origen de una cita literaria tras visionar un episodio de StarTrek. En casi todos los episodios de Star Trek se citan librosdisponibles en versión digital en el Proyecto Gutenberg.

El objetivo, entonces, es que el público, esté o no esté acostumbradoal contacto con el libro impreso, pueda encontrar con facilidad lostextos escuchados en conversaciones, películas, músicas, o leídos enotros libros, periódicos y revistas.

Los textos electrónicos (llamados también ―etexts‖ o ―ebooks‖) estánalmacenados bajo la forma más sencilla posible, en formato ASCII(American Standard Code for Information Interchange –

CódigoEstadounidense Estándar para el Intercambio de Información), para queesos textos pudieran ser leídos sin problema con cualquier plataforma ysoftware. Los términos escritos en cursiva o en negrita y los términossubrayados en la versión impresa están en letras capitales. Losarchivos ASCII no ocupan mucho espacio y se pueden descargarfácilmente. La búsqueda textual es igual de sencilla. Basta conutilizar la función "buscar" presente en cualquier software.

Michael Hart explica en agosto de 1998 en una entrevista por correoelectrónico: ―Nosotros consideramos el texto electrónico como un nuevomedio de comunicación, sin verdadera relación con el papel. La únicasemejanza es que ambos difundimos las mismas obras, pero en cuanto lagente se haya acostumbrado, no veo cómo el papel aún podría competircon el texto electrónico, sobre todo en las escuelas. (…) Mi proyectoes cargar 10.000 textos electrónicos en el internet [esta meta sealcanza en octubre de 2003]. Si pudiera conseguir subvenciones másimportantes, me gustaría llegar hasta un millón y ampliar también elnúmero de nuestros usuarios potenciales pasando de un 1,x% a un 10% dela población mundial, lo que representaría la distribución de 1.000veces un billón de textos electrónicos en lugar de un solo billón.‖

# De 1.000 a 10.000 ebooks

Entre 1998 y 2000, la producción sigue constante, con una media de 36nuevos ebooks al mes. En mayo de 1999, las colecciones cuentan con2.000 libros digitales. El eBook #2000 es Don Quijote (publicado en1605), en castellano.

Distributed Proofreaders (DP) es lanzado en octubre de 2000 por CharlesFranks para repartir la corrección de las obras entre varias personas.Los voluntarios eligen uno de los libros digitales disponibles en elsitio web para releer y corregir determinada página. Cada cual trabajaa su ritmo. A título indicativo, se aconseja repasar una página al día.Representa poco tiempo en un día, pero mucho para el proyecto.

Disponible en diciembre del año 2000, el eBook #3000 es el tercervolumen de À l'ombre des jeunes filles en fleurs (A la sombra de lasmuchachas en flor, 1919) de Marcel Proust, en su idioma original, elfrancés.

La media pasa a 104 nuevos ebooks al mes en 2001.

El Project Gutenberg Australia es lanzado en agosto de 2001.

Disponible en octubre de 2001, el eBook #4000 es The French ImmortalsSeries (Obras de los Inmortales franceses), en versión inglesa.Publicado en 1905 por la Maison Mazarin (París), este libro reúnevarias ficciones de escritores laureados por la Academia de la LenguaFrancesa (Académie Française), como Emile Souvestre, Pierre Loti,Hector Malot, Charles de Bernard, Alphonse Daudet y otros.

Disponible en abril de 2002, el eBook #5000 es The Notebooks ofLeonardo da Vinci (Los cuadernos de Leonardo da Vinci), que datan deinicios de siglo 16, en una traducción del italiano al inglés. En 2010,este texto aún se encuentra en el Top 100 de los libros descargados conmás frecuencia.

En 1991, Michael Hart decidió digitalizar Alice‘s Adventures inWonderland o Peter Pan porque su versión digital cupo en un disquete de360 K (kilobytes), o sea el estándar de la época. Quince años mástarde, en 2002, ya disponemos de disquetes de 1,44 M (megabytes) con laposibilidad de comprimir archivos en archivos ZIP. Un archivo estándarpuede contener tres millones de caracteres, o sea más de los necesariospara un libro de tamaño mediano, ya que una novela de 300 páginasdigitalizada en formato ASCII representa 1 M (megabyte). Un librovoluminoso cabe en dos archivos ASCII, descargables en versión normal oen versión comprimida en un archivo ZIP.

Se necesitan unas cincuenta horas para seleccionar un libro de tamañomediano, comprobar que ha pasado al dominio público, escanearlo,corregirlo, formatearlo y compaginarlo.

Algunos números de libros se reservan para más tarde, por ejemplo elnúmero 1984 (eBook #1984) para la novela epónima de George Orwell,publicada en 1949, que aún está lejos de pasar al dominio público.

Al llegar la primavera de 2002, ya cubren un cuarto de las obras deldominio público de libre acceso en la web, inventariadas de forma casiexhaustiva por la Internet Public Library (IPL – Biblioteca Pública delInternet), un buen resultado que es el fruto del trabajo paciente demiles de voluntarios activos en numerosos países. En 2002, lascolecciones se amplían de 203 nuevos ebooks al mes.

En noviembre de 2002, el Proyecto Gutenberg pone en línea los 75archivos del Human Genome Project (Proyecto del Genoma Humano, es saberla secuenciación del genoma humano), poco tiempo después de supublicación inicial en febrero de 2001, debido a que desde el principioya pertenecía al dominio público.

Cada archivo se compone de decenas, oincluso de cientos de megabytes.

1.000 ebooks en agosto de 1997, 2.000 ebooks en mayo de 1999, 3.000ebooks en diciembre de 2000, 4.000

ebooks en octubre de 2001, 5.000ebooks en abril de 2002, 10.000 ebooks en octubre de 2003. El eBook#10.000 es The Magna Carta, que fue el primer texto constitucionalinglés, firmado en 1215.

Entre abril de 2002 y octubre de 2003, las colecciones se duplican,pasando de 5.000 a 10.000 libros digitales en 18 meses. En 2003, laproducción es de unos 348 nuevos ebooks al mes. Este crecimiento rápidose debe a la actividad de Distributed Proofreaders (DP), concebido enoctubre de 2000 para repartir la corrección de las obras entre muchosvoluntarios.

En agosto de 2003, se pone a disposición un CD Best of Gutenberg conuna selección de 600 ebooks. En diciembre de 2003, fecha en la que elProyecto Gutenberg alcanza la cifra de 10.000 libros digitales, segraba en un DVD la casi totalidad de los ebooks (9.400 ebooks). Seenvían gratuitamente el CD y el DVD a cualquier persona que lo pida.Luego cada uno queda libre de realizar todas las copias que pueda y dedistribuirlas a su alrededor en escuelas y bibliotecas.

En septiembre de 2003, el Proyecto Gutenberg lanza el Project GutenbergAudio eBooks, una collección de libros audio (leídos por el serhumano), así como el Sheet Music Subproject (Subproyecto parapartituras), una collección de partituras digitalizadas y degrabaciones musicales. Un otro subproyecto también ofrece unacollección de imágenes.

# De 10.000 a 20.000 ebooks

En diciembre de 2003, las colecciones rondan los 11.000 librosdigitales. Varios formatos están representados (HTML, XML, RTF, etc.)pero el formato principal - y obligatorio - sigue siendo el ASCII.

Hay46.000 archivos en conjunto, lo que equivale a una capacidad total de110 G (gigabytes). El 13 de febrero de 2004, fecha en la que MichaelHart da una conferencia en la sede de la UNESCO en París, lascolecciones abarcan exactamente 11.340 ebooks en 25 idiomas. En mayo de2004, los 12.500 ebooks disponibles representan 100.000 archivos enveinte formatos diferentes, lo que equivale a una capacidad total de135 G (gigabytes), y ésta debería duplicarse cada año con la agregaciónde más de 300 ebooks al mes (338 ebooks al mes en 2004).

El Project Gutenberg Consortia Center (PGCC), lanzado en 1997 parareunir otras colecciones de libros digitales en un punto de accesoúnico, es afiliado oficialmente al Proyecto Gutenberg en 2003.

Se inicia también un proyecto europeo a iniciativa del Proyecto Rastko,basado en Belgrado (Serbia). El Proyecto Gutenberg Europa y DistributedProofreaders Europa nacen en enero de 2004, con cien libros disponiblespara abril de 2005, en varios idiomas con el fin de reflejar ladiversidad lingüística que prevalece en Europa.

En enero de 2005, el Proyecto Gutenberg pone en línea el eBook #15000,The Life of Reason (La vida de la razón, 1906) de George Santayana.

Si bien en febrero de 2004 sólo había libros en 25 idiomas, en julio de2005 están representados 42 idiomas, entre los cuales el sanscrito ylas lenguas maya.

El Project Gutenberg Australia (lanzado en agosto de 2001) celebra sus500 libros en julio de 2005.

En enero de 2006 se crea el Project Gutenberg PrePrints para acogernuevos documentos que por su interés merecerían estar en línea, peroque no pueden ser incorporados a las colecciones existentes sin suprocesamiento previo por voluntarios: colecciones incompletas, calidadinsuficiente, necesidad de conversión a otro formato, etc. LosPrePrints cuentan con 379 ebooks en diciembre de 2006, y 2.020

ebooksen febrero de 2009.

En diciembre de 2006, el Proyecto Gutenberg alcanza los 20.000 librosdigitales. El eBook #20000 es un libro audio, Twenty Thousand LeaguesUnder the Sea (Veinte mil leguas de viaje submarino, 1869), la versióninglesa de la novela de Julio Verne en francés. En 2006, la producciónes de unos 345 nuevos ebooks al mes.

Aunque se hayan necesitado 32 años y tres meses, de julio de 1971 aoctubre de 2003, para producir los 10.000 primeros ebooks, bastará consólo tres años y dos meses, de octubre de 2003 a diciembre de 2006,para producir los 10.000 ebooks siguientes.

Por la misma fecha, el Project Gutenberg Australia ronda los 1.500ebooks (se alcanza esta cifra en abril de 2007) y el Proyecto GutenbergEuropa cuenta con 400 ebooks.

En diciembre de 2006 figuran 50 idiomas. Diez idiomas cuentan concolecciones de más de 50 libros: el inglés (17.377 libros el 16 dediciembre de 2006), el francés (966 libros), el alemán (412 libros), elfinlandés (344 libros), el holandés (244 libros), el español (140libros), el italiano (102 libros), el chino (69 libros), el portugués(68 libros) y el tagalog (51 libros).

# De 20.000 a 30.000 ebooks

Se estrena el blog Project Gutenberg News en noviembre de 2006 ainstigación de Mike Cook, para complementar las cartas de información(semanal y mensual) que ya llevaban muchos años de existencia.

El blog presenta por ejemplo las estadísticas de producción semanales,mensuales y anuales desde 2001.

La producción semanal se eleva a 24 libros en 2001, 47 libros en 2002,79 libros en 2003, 78 libros en 2004, 58 libros en 2005 y 80 libros en2006.

La producción mensual es de 104 libros en 2001, 203 libros en 2002, 348libros en 2003, 338 libros en 2004, 252 libros en 2005 y 345 libros en2006.

La producción anual es de 1.244 libros en 2001, 2.432 libros en 2002,4.176 libros en 2003, 4.058 libros en 2004, 3.019 libros en 2005 y4.141 libros en 2006.

El Proyecto Gutenberg Canadá (PGC) ve la luz el 1° de julio de 2007,día de la fiesta nacional, a instigación de Michael Shepard y DavidJones. Poco después nace Distributed Proofreaders Canadá (DPC) cuyaproducción empieza en diciembre de 2007. Los cien primeros ebooks estándisponibles en marzo de 2008, en inglés, en francés y en italiano.

Distributed Proofreaders (DP), lanzado en octubre de 2000, cuenta conmiles de voluntarios en enero de 2008, con un total de 11.934 librosprocesados en siete años y tres meses. Distributed Proofreaders Europa(DP Europe), lanzado en enero de 2004, cuenta con 1.500 voluntarios.Distributed Proofreaders Canadá (DPC), lanzado en diciembre de 2007,cuenta con 250 voluntarios.

El Proyecto Gutenberg alcanza los 25.000 libros digitales en abril de2008. El eBook #25000 es English Book Collectors (Colleccionistasingleses de libros, 1902) de William Younger Fletcher.

El Proyecto Gutenberg Europa alcanza los 500 libros en octubre de 2008.

El Proyecto Gutenberg contabiliza 30.000 libros en octubre de 2009. EleBook #30000 es The Bird Book (El libro de los aves, 1915), de ChesterAlbert Reed.

# 30.000 ebooks y más

Distributed Proofreaders celebra su décimo aniversario en octubre de2010, con más de 18.000 libros digitalizados y corregidos en diez añospor miles de voluntarios.

El Proyecto Gutenberg cuenta con más de 33.000 ebooks en diciembre de2010, en varios formatos para lectura en un ordenador, un PDA, unteléfono móvil, un smartphone o una tableta.


Au 16e siècle, Gutenberg avait permis à chacun d'avoir des livresimprimés pour un prix relativement modique. Au 21e siècle, le ProjetGutenberg permettrait à chacun d'avoir une bibliothèque numériquegratuite.

# Gestation

Quels furent les tous débuts du projet? Alors étudiant à l‘Universitéde l'Illinois (États-Unis), Michael Hart se voit attribuer quelquesmillions de dollars de «temps machine» dans le laboratoire informatiquede son université.

Le 4 juillet 1971, jour de la fête nationale, il saisit The UnitedStates Declaration of Independence (Déclaration de l‘indépendance desÉtats-Unis) sur le clavier de son ordinateur, en caractères majuscules,puisque les caractères minuscules n‘existent pas encore. Le texteélectronique représente 5 Ko (kilo-octets). L‘envoi d‘un fichier de 5Ko à la centaine de personnes utilisant le pré-internet de l'époqueaurait fait imploser celui-ci, la bande passante étant infime. Michaeldiffuse donc un message indiquant où le texte est stocké - sans lienhypertexte toutefois, puisque le web ne voit le jour que vingt ansaprès - suite à quoi le fichier est téléchargé par six personnes. LeProjet Gutenberg est né.

Dans la foulée, Michael décide de consacrer l'énorme crédit-temps mis àsa disposition à la recherche des oeuvres littéraires disponibles dansles bibliothèques et à la numérisation de celles-ci. Au lieu d‘être unensemble de pages reliées, le livre sera un texte électronique pouvantêtre déroulé en continu.

Peu après, Michael définit la mission du Projet Gutenberg: mettre à ladisposition de tous gratuitement, par voie électronique, le plus grandnombre possible d‘oeuvres littéraires.

Après avoir saisi The United States Declaration of Independence(Déclaration de l‘indépendance des États-Unis, signée le 4 juillet1776) en 1971, Michael poursuit ses efforts en 1972 en saisissant TheUnited States Bill of Rights (Déclaration des droits des États-Unis).Ce texte comprend les dix premiers amendements ajoutés en 1789 à laConstitution des États-Unis (qui date elle-même de 1787), etdéfinissant les droits individuels des citoyens et les pouvoirsrespectifs du gouvernement fédéral et des États. En 1973, un volontairesaisit The United States Constitution (Constitution des États-Unis)dans son entier.

L‘internet, qui était encore embryonnaire en 1971, débute véritablementen 1974, suite à la création du protocole TCP/IP (Transmission ControlProtocol / Internet Protocol).

D‘année en année, la capacité de la disquette augmente régulièrement -le disque dur n‘existe pas encore -, si bien qu'il est possibled‘envisager des fichiers de plus en plus volumineux. Des volontairesentreprennent la numérisation de La Bible, composée elle-même deplusieurs livres pouvant être traités séparément et occuper chacun unfichier différent.

Michael Hart débute la saisie des oeuvres complètes de Shakespeare,avec l'aide de volontaires, une pièce de théâtre après l‘autre, avec unfichier pour chaque pièce. Cette version n'est d‘ailleurs jamais miseen ligne, du fait d‘une loi plus contraignante sur le copyright entréeen vigueur dans l‘intervalle, et qui vise non pas le texte deShakespeare, tombé depuis longtemps dans le domaine public, mais lescommentaires et notes de l'édition correspondante. D‘autres éditionsannotées appartenant au domaine public sont mises en ligne quelquesannées plus tard.

# De 10 à 1.000 ebooks

En août 1989, le Projet Gutenberg met en ligne l'eBook #10, The KingJames Bible, une bible publiée pour la première fois en 1611 et dont laversion la plus connue date de 1769. L'ensemble des fichiers del'Ancien Testament et du Nouveau Testament représente 5 Mo (méga-octets).

En 1990, les internautes sont au nombre de 250.000, et le standard envigueur est la disquette de 360 Ko. En janvier 1991, Michael Hartsaisit Alice‘s Adventures in Wonderland (Alice au pays des merveilles,1865) de Lewis Carroll. En juillet de la même année, il saisit PeterPan (1904) de James M. Barrie. Ces deux classiques de la littératureenfantine tiennent chacun sur une disquette standard.

Arrive ensuite le web, opérationnel en 1991. Le premier navigateur,Mosaic, apparaît en novembre 1993.

Lorsque l‘utilisation du web segénéralise, il devient plus facile de faire circuler les textesélectroniques et de recruter des volontaires.

Le Projet Gutenberg rode sa méthode de travail, avec la numérisationd‘un texte par mois en 1991, deux textes par mois en 1992, quatretextes par mois en 1993 et huit textes par mois en 1994.

En janvier 1994, le Projet Gutenberg met en ligne l'eBook #100, TheComplete Works of William Shakespeare (Les oeuvres complètes de WilliamShakespeare). Shakespeare écrivit l'essentiel de son oeuvre entre 1590et 1613.

La production continue ensuite d‘augmenter, avec une moyenne de 16nouveaux titres par mois en 1995 et 32 nouveaux titres par mois en1996.

Comme on le voit, entre 1991 et 1996, la production double chaqueannée. Tout en continuant de numériser des livres, Michael coordonnedésormais le travail de dizaines de volontaires.

En 1997, la production est toujours de 32 nouveaux titres par mois. Enjuin 1997, le Projet Gutenberg met en ligne The Merry Adventures ofRobin Hood (Les aventures de Robin des Bois, 1883) de Howard Pyle.

Enaoût 1997, il met en ligne l'eBook #1000, La Divina Commedia (La DivineComédie, 1321) de Dante Alighieri, dans sa langue d‘origine, enitalien.

À l'époque, le Projet Gutenberg s‘articule en trois grands secteurs:(a) «Light Literature» (littérature de divertissement), qui inclut parexemple Alice‘s Adventures in Wonderland, Peter Pan ou Aesop‘s Fables(Fables d‘Ésope); (b) «Heavy Literature» (littérature «sérieuse»), quiinclut par exemple La Bible, les oeuvres de Shakespeare ou Moby Dick;(c) «Reference Literature» (littérature de référence), composéed‘encyclopédies et de dictionnaires, par exemple le Roget‘s Thesaurus.Un classement par rubriques plus détaillé remplacera par la suite cestrois secteurs.

Le Projet Gutenberg se veut universel, aussi bien pour les oeuvreschoisies que pour le public visé, le but étant de mettre la littératureà la disposition de tous, en dépassant largement le public habituel desétudiants et des enseignants. Le secteur consacré à la littérature dedivertissement est destiné à amener devant l‘écran un public trèsdivers, par exemple des enfants et leurs grands-parents recherchant letexte électronique de Peter Pan après avoir vu le film Hook, ourecherchant la version électronique d‘Alice au pays des merveillesaprès avoir regardé l'adaptation filmée à la télévision, ou recherchantl‘origine d‘une citation littéraire après avoir vu un épisode de StarTrek. Pratiquement tous les épisodes de Star Trek citent des livresayant leur correspondant numérique dans le Projet Gutenberg.

L‘objectif est donc que le public, qu‘il soit familier ou non avec lelivre imprimé, puisse facilement retrouver des textes entendus dans desconversations, des films, des musiques, ou alors lus dans d‘autreslivres, journaux et magazines.

Les textes électroniques (appelés ―etexts‖ ou ―ebooks‖) sont stockés dela manière la plus simple possible, au format ASCII (American StandardCode for Information Interchange), pour que ces textes puissent êtrelus sans problème quels que soient la plateforme et le logicielutilisés. Des lettres capitales remplacent les termes en italique, engras et soulignés de la version imprimée. Les fichiers électroniquesprennent peu de place et peuvent être facilement téléchargés. Larecherche textuelle est tout aussi simple. Il suffit d‘utiliser lafonction «rechercher» présente dans n‘importe quel logiciel.

Michael Hart écrit en août 1998 lors d'un entretien par courriel: «Nousconsidérons le texte électronique comme un nouveau médium, sansvéritable relation avec le papier. Le seul point commun est que nousdiffusons les mêmes oeuvres, mais je ne vois pas comment le papier peutconcurrencer le texte électronique une fois que les gens y sonthabitués, particulièrement dans les établissements d'enseignement.

(…)Mon projet est de mettre 10.000 textes électroniques sur l‘internet.[NDLR: Ce sera chose faite en octobre 2003.] Si je pouvais avoir dessubventions importantes, j‘aimerais aller jusqu‘à un million et étendreaussi le nombre de nos usagers potentiels de 1,x% à 10% de lapopulation mondiale, ce qui représenterait la diffusion de 1.000 foisun milliard de textes électroniques, au lieu d‘un milliard seulement.»

# De 1.000 à 10.000 ebooks

Entre 1998 et 2000, la moyenne est constante, avec 36 nouveaux titrespar mois. En mai 1999, les collections comptent 2.000 livresnumériques. L'eBook #2000 est Don Quijote (Don Quichotte, 1605) deCervantes, dans sa langue d‘origine, en espagnol.

Distributed Proofreaders (DP) est lancé en octobre 2000 par CharlesFranks pour permettre la correction partagée des livres entre denombreux volontaires. Les volontaires choisissent un livre en cours detraitement pour relire et corriger une page donnée. Chacun travaille àson propre rythme. A titre indicatif, il est conseillé de relire unepage par jour. C‘est peu de temps sur une journée, et c‘est beaucouppour le projet.

Disponible en décembre 2000, l'eBook #3000 est le troisième volume de Àl‘ombre des jeunes filles en fleurs (1919) de Marcel Proust, dans salangue d'origine, en français. La moyenne passe à 104 livres par moisen 2001.

Le Project Gutenberg Australia voir le jour en août 2001.

Mis en ligne en octobre 2001, l'eBook #4000 est The French ImmortalsSeries (Collection de textes d'Immortels français), dans sa traductionanglaise. Publié à Paris en 1905 par la Maison Mazarin, ce livrerassemble plusieurs fictions d‘écrivains couronnés par l‘Académiefrançaise, comme Émile Souvestre, Pierre Loti, Hector Malot, Charles deBernard, Alphonse Daudet, etc.

Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardoda Vinci (Les Carnets de Léonard de Vinci), des carnets datant du débutdu 16e siècle et traduits de l'italien vers l'anglais. Ces carnets ontconstamment été dans le Top 100 des livres téléchargés depuis leur miseen ligne.

En 1991, Michael Hart avait choisi de numériser Alice‘s Adventures inWonderland et Peter Pan parce que, dans l‘un et l‘autre cas, leurversion numérisée tenait sur une disquette de 360 Ko, le standard del‘époque.

Quinze ans plus tard, en 2002, on dispose de disquettes de1,44 Mo et on peut aisément compresser les fichiers en les zippant. Unfichier standard peut désormais comporter trois millions de caractères,plus qu‘il n‘en faut pour un livre de taille moyenne, puisqu'un romande 300 pages numérisé au format ASCII représente un méga-octet. Unlivre volumineux tient sur deux fichiers ASCII, téléchargeables telsquels ou en version zippée.

Cinquante heures environ sont nécessaires pour sélectionner un livre detaille moyenne, vérifier qu‘il est bien du domaine public, le scanner,le corriger, le formater et le mettre en page.

Quelques numéros de livres sont réservés pour l‘avenir, par exemple lenuméro 1984 (eBook #1984) pour le roman éponyme de George Orwell,publié en 1949, et qui est donc loin d‘être tombé dans le domainepublic.

Au printemps 2002, les collections représentent le quart des oeuvres dudomaine public en accès libre sur le web, recensées de manièrepratiquement exhaustive par l‘Internet Public Library (IPL), un beaurésultat dû au patient travail de milliers de volontaires actifs dansde nombreux pays. En 2002, la production est de 203 nouveaux titrespar mois.

En novembre 2002, le Projet Gutenberg met en ligne les 75 fichiers duHuman Genome Project (Projet du génome humain, à savoir le séquençagedu génome humain), ceci peu de temps après sa parution initiale enfévrier 2001, puisqu‘il appartient d‘emblée au domaine public. Chaquefichier se chiffre en dizaines sinon en centaines de méga-octets.

1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres endécembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril2002, 10.000 livres en octobre 2003. L'eBook #10000 est The MagnaCarta, qui fut le premier texte constitutionnel anglais, signé en 1215.

Entre avril 2002 et octobre 2003, les collections doublent, passant de5.000 à 10.000 livres en dix-huit mois.

La moyenne mensuelle est de 348nouveaux titres en 2003. Cette croissance rapide est due à l‘activitéde Distributed Proofreaders (DP), un site conçu en octobre 2000 pourpermettre la correction partagée des livres entre de nombreuxvolontaires.

En août 2003, un CD Best of Gutenberg est disponible avec une sélectionde 600 ebooks. En décembre 2003, date à laquelle le Projet Gutenbergfête ses 10.000 ebooks, la quasi-totalité de ceux-ci (9.400 ebooks) estgravée sur un DVD. CD et DVD sont envoyés gratuitement à qui en fait lademande. Libre ensuite à chacun de faire autant de copies que possibleet de les distribuer autour de soi dans des écoles et desbibliothèques.

En septembre 2003, le Projet Gutenberg lance le Projet Gutenberg AudioeBooks, une collection de livres audio (lus par l'être humain), ainsique le Sheet Music Subproject (Sous-projet pour les partitionsmusicales), une collection rassemblant des partitions musicales et desenregistrements musicaux. Un autre sous-projet rassemble des imagesfixes et animées.

# De 10.000 à 20.000 ebooks

En décembre 2003, les collections approchent les 11.000 ebooks.Plusieurs formats sont désormais présents, par exemple les formatsHTML, XML et RTF, le format principal - et obligatoire – restantl‘ASCII. Le tout représente 46.000 fichiers, soit une capacité totalede 110 Go (giga-octets). Le 13 février 2004, date de la conférence deMichael Hart au siège de l‘UNESCO à Paris, les collections comprennenttrès exactement 11.340 ebooks dans 25 langues. En mai 2004, les 12.500ebooks disponibles représentent 100.000 fichiers dans une vingtaine deformats, soit une capacité totale de 135 Go, destinée à doubler chaqueannée avec l‘ajout d'environ 300 ebooks par mois (338 ebooks en 2004).

Parallèlement, le Project Gutenberg Consortia Center (PGCC), qui avaitété lancé en 1997 pour rassembler des collections de livres numériquesdéjà existantes et provenant de sources diverses, est officiellementaffilié au Projet Gutenberg en 2003.

Le Projet Gutenberg Europe est lancé en janvier 2004 à l‘instigation duProjet Rastko, basé à Belgrade, en Serbie. Distributed ProofreadersEurope débute la production de livres numériques à la même date, aveccent livres disponibles en avril 2005. Les livres sont en plusieurslangues pour refléter la diversité linguistique prévalant en Europe.

En janvier 2005, le Projet Gutenberg met en ligne l'eBook #15000, TheLife of Reason (La vie de raison, 1906) de George Santayana.

En juin 2005, le nombre de livres s‘élève à 16.000. Si 25 languesseulement étaient présentes en février 2004, 42 langues sontreprésentées en juin 2005, dont le sanscrit et les langues mayas.

Le Project Gutenberg Australia (lancé en août 2001) fête ses 500 livresen juillet 2005.

Un nouveau secteur, dénommé Project Gutenberg PrePrints, est lancé enjanvier 2006 pour accueillir de nouveaux documents suffisammentintéressants pour être mis en ligne, mais ne pouvant être intégrés auxcollections du Projet Gutenberg sans traitement ultérieur par desvolontaires, pour diverses raisons: collections incomplètes, qualitéinsuffisante, conversion souhaitée dans un autre format, etc. LesPrePrints comprennent 379 ebooks en décembre 2006, et 2.020 ebooks enfévrier 2009.

En décembre 2006, le Projet Gutenberg franchit la barre des 20.000livres. L'eBook #20000 est un livre audio, Twenty Thousand LeaguesUnder the Sea, version anglaise du roman Vingt mille lieues sous lesmers (1869) de Jules Verne. La moyenne est de 345 nouveaux titres parmois en 2006.

S'il a fallu 32 ans et deux mois, de juillet 1971 à octobre 2003, pournumériser les 10.000 premiers livres, il n‘aura fallu que trois ans etdeux mois, d‘octobre 2003 à décembre 2006, pour numériser les 10.000livres suivants.

À la même date, le Project Gutenberg Australia approche les 1.500livres (c'est chose faite en avril 2007) et le Projet Gutenberg Europecompte 400 livres.

En décembre 2006, on compte 50 langues. Les dix langues comprenant plusde cinquante livres sont l‘anglais (17.377 livres le 16 décembre 2006),le français (966 livres), l‘allemand (412 livres), le finnois (344livres), le hollandais (244 livres), l‘espagnol (140 livres), l‘italien(102 livres), le chinois (69 livres), le portugais (68 livres) et letagalog (51 livres).

# De 20.000 à 30.000 ebooks

Project Gutenberg News, le blog officiel du Projet Gutenberg, débute ennovembre 2006 à l‘instigation de Mike Cook. Ce blog complète leslettres d‘information (hebdomadaire et mensuelle) existant depuisnombre d'années. Le blog offre par exemple les statistiques deproduction hebdomadaires, mensuelles et annuelles depuis 2001.

La production hebdomadaire est de 24 livres en 2001, 47 livres en 2002,79 livres en 2003, 78 livres en 2004, 58 livres en 2005 et 80 livres en2006.

La production mensuelle est de 104 livres en 2001, 203 livres en 2002,348 livres en 2003, 338 livres en 2004, 252 livres en 2005 et 345livres en 2006.

La production annuelle est de 1.244 livres en 2001, 2.432 livres en2002, 4.176 livres en 2003, 4.058 livres en 2004, 3.019 livres en 2005et 4.141 livres en 2006.

Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, lejour de la fête nationale, à l'instigation de Michael Shepard et DavidJones. Il est suivi de Distributed Proofreaders Canada (DPC), avec uneproduction qui débute en décembre 2007. Les cent premiers livres sontdisponibles en mars 2008, en anglais, en français et en italien.

Le Projet Gutenberg envoie 15 millions de livres sur CD ou DVD parcourrier postal en 2007. Le DVD le plus récent (qui date de juillet2006) comprend 17.000 livres. Le contenu des CD et DVD est égalementdisponible sous forme de fichiers ISO (depuis 2005) peuvant êtretéléchargés pour graver des CD

et DVD.

Le Projet Gutenberg compte 25.000 livres en avril 2008. L'eBook #25000est English Book Collectors (Collectionneurs de livres anglais, 1902)de William Younger Fletcher.

Le Projet Gutenberg Europe atteint les 500 livres en octobre 2008.

Le Projet Gutenberg comptabilise 30.000 livres en octobre 2009. L'eBook#30000 est The Bird Book (Le livre des oiseaux, 1915), de ChesterAlbert Reed.

# 30.000 ebooks et plus

Principale source des livres du Projet Gutenberg, DistributedProofreaders (DP) fête son dixième anniversaire en octobre 2010, avecplus de 18.000 livres patiemment numérisés, relus et corrigés pendantdix ans par plusieurs milliers de volontaires.

Le Projet Gutenberg propose plus de 33.000 ebooks de grande qualité endécembre 2010, dans divers formats pour lecture sur ordinateur, PDA,téléphone mobile, smartphone et tablette.


The results of Project Gutenberg are not only measured in numbers. Theresults can also be measured in the major influence the project hashad.

# Other digital libraries

As the oldest producer of free ebooks on the internet, Project Gutenberg has inspired many other digital libraries, for example Projekt Runeberg for classic Nordic (Scandinavian) literature, and Projekt Gutenberg-DE for classic German literature, which started respectively in 1992 and 1994.

Projekt Runeberg was the first Swedish digital library of books frompublic domain, and a partner of Project Gutenberg. It was initiated inDecember 1992 by the students‘ computer club Lysator, in cooperationwith the Linköping University (Sweden), as a volunteer project tocreate and collect free electronic editions of classic Nordicliterature and art. Around 200 ebooks were available in full text in1998. There was also a list of 6,000 Nordic authors as a tool forfurther collection development.

Projekt Gutenberg-DE was the first German digital library of books frompublic domain, created in 1994 as a partner of Project Gutenberg. Textswere available for online reading, with one webpage for short texts andwith several webpages – one per chapter – for longer works. There wasan alphabetic list of authors and titles, and a short biography andbibliography for each author.

# ―Less is more.‖

Project Gutenberg has kept its administrative and financial structureto the bare minimum. Its motto fits into three words: ―Less is more.‖The goal is to ensure its independence from loans and other funding,and from ephemeral cultural priorities, to avoid pressure frompoliticians and others. The goal is also to ensure respect for thevolunteers, who can be confident their work will be used for decades.Volunteers can network through mailing lists, weekly or monthlynewsletters, discussion lists, forums, and wikis. Founded in 2000, thePGLAF (Project Gutenberg Literary Archive Foundation) has only threepart-time employees.

Donations are used to buy equipment and supplies, mostly computers,scanners, and blank CDs and DVDs.

CDs and DVDs are sent for free tothose who request them. After the CD Best of Gutenberg available inAugust 2003 with a selection of 600 ebooks, and a first DVD availablein December 2003 with 9,400

ebooks, a second DVD is available in July2006 with 17,000 ebooks. Since 2005, CDs and DVDs have been bothavailable on the website of BitTorrent as ISO images that can bedownloaded to burn CDs and DVDs for personal use. In 2007, the ProjectGutenberg sent 15 million books by snail mail on CDs and DVDs.

More generally, Michael Hart should be given more credit as theinventor of the electronic book (ebook). If we consider the ebook inits etymological sense – i.e. a book that has been digitized to bedistributed as an electronic file – it was born with Project Gutenbergin July 1971, 30 years before the various commercial launchings thatpeppered the early 2000s, with the ebooks of Amazon, Barnes & Noble,Gemstar, and others.

# Tens of thousands of downloads per day

There is a big demand, as confirmed by the tens of thousands of booksthat are downloaded every day.

For example, on July 31, 2005, there were 37,532 downloads for the day,243,808 downloads for the week, and 1,154,765 downloads for the month.

On May 6, 2007, there were 89,841 downloads for the day, 697,818downloads for the week, and 2,995,436

downloads for the month.

On November 15, 2010, there were 130,524 downloads for the day, 888,520downloads for the week, and 3,582,153 downloads for the month.

These numbers are the downloads from (at the University ofNorth Carolina, Chapel Hill, United States), the main distributionsite, which also hosts the website The Internet Archiveis the backup distribution site and provides unlimited disk space forstorage and processing. Project Gutenberg has 40 mirror sitesworldwide, and seeks new ones. It also encourages the use of P2P forsharing its ebooks.

Readers can choose ebooks from the ―Top 100?, i.e. the top 100 ebooksand the top 100 authors for the previous day, the last seven days andthe last thirty days.

Project Gutenberg ebooks can also help bridge the ―digital divide‖.They can be read on an outdated computer or a second-hand netbookcosting just a few dollars.

# Towards the future

It is hoped machine translation software will be able to convert theebooks from one to another of 100

languages. In ten years from now,machine translation may be judged 99% satisfactory – research is activeon that front, and software is improving fast – allowing for thereading of literary classics in a choice of many languages. ProjectGutenberg is also interested in combining translation software andhuman translators, somewhat as OCR software is now combined with thework of proofreaders.

40 years after the beginning of Project Gutenberg, Michael Hartdescribes himself as a workaholic who has devoted his entire life tohis project. He considers himself a pragmatic and farsighted altruist.For years he was regarded as a nut but now he is respected. He wants tochange the world through freely-available ebooks that can be used andcopied endlessly, and reading and culture for everyone at minimal cost.

Project Gutenberg‘s mission can be stated in eight words: ―To encouragethe creation and distribution of ebooks,‖ by everybody, and by everypossible means, while implementing new ideas, new methods, and newsoftware.


Los resultados del Proyecto Gutenberg no se miden sólo en cifras. Losresultados se miden también por la influencia que ha tenido elproyecto, pues ésta ha sido enorme.

# Otras bibliotecas digitales

El Proyecto Gutenberg – primera página web de información en elinternet y primera biblioteca digital –, inspira muchas otrasbibliotecas digitales, por ejemplo el Projekt Runeberg para laliteratura escandinava o el Projekt Gutenberg-DE para la literaturaalemana.

El Projekt Runeberg es la primera biblioteca digital sueca de librosdel dominio público, y un socio del Proyecto Gutenberg. Esta bibliotecaes creada en diciembre de 1992 por Lysator, un club informático deestudiantes, en colaboración con la biblioteca de la Universidad deLinköping (Suecia), para producir y organizar versiones electrónicasgratuitas de obras de literatura nórdica (escandinava) clásica. 200obras están disponibles en 1998, con una lista de 6.000 autoresnórdicos para el desarrollo de las colecciones futuras.

El Projekt Gutenberg-DE es la primera biblioteca digital alemana delibros del dominio público, y también un socio del Proyecto Gutenberg.Se pueden leer decenas de textos en línea en 1998, con una página webpara textos cortos y varias páginas web - uno por capítulo – para obrasmás largas. Una lista alfabética de autores y de títulos estádisponible en el sitio, con una breve biografía y bibliografía paracada autor.

# Una estructura tan simple como posible

La estructura administrativa y financiera del Proyecto Gutenberg selimita al mínimo estricto. Michael Hart insiste frecuentemente sobre lanecesidad de preservar un marco lo más flexible posible que deje campolibre a los voluntarios, y la puerta abierta para las nuevas ideas. Elobjetivo es garantizar la perennidad del proyecto, sin depender ni decréditos y cortes de créditos, ni de las prioridades culturales,financieras y políticas del momento. De este modo no puede ejercerseninguna forma de presión por el poder o el dinero.

Además estosignifica respeto para con los voluntarios, quienes pueden estarseguros de que verán su trabajo utilizado durante muchos años. Encuanto a la supervisión regular del proyecto, se garantiza gracias acartas de información semanales y mensuales, foros de discusión, wikisy blogs.

Las donaciones sirven para financiar ordenadores y escáneres, y paraenviar CD y DVD gratuitos a aquéllos que los solicitan. Después del CD"Best of Gutenberg" disponible en agosto de 2003 con una selección de600 libros y de un primer DVD disponible en diciembre de 2003 con 9.400libros, un segundo DVD está disponible en julio de 2006 con 17.000libros. A partir de 2005, CD y DVD ambos están disponibles en el sitioweb de BitTorrent, bajo la forma de imágenes ISO que se puedendescargar con el fin de grabar CD y DVD a título personal. En 2007, elProyecto Gutenberg envía 15 millones de libros por correo postal bajola forma de CD y DVD.

Aunque demasiadas veces se silencie, cabe recordar que el verdaderoinventor del ebook es Michael Hart. Si tomamos la palabra "ebook" en susentido etimológico – a saber un libro digital para difusión bajo laforma de un archivo electrónico - habría nacido con el ProyectoGutenberg en julio de 1971, 30 años antés de los diversos lanzamientoscomerciales que salpicaron el principio de los años 2000 con los ebooksde Amazon, Barnes & Noble, Gemstar y demás.

# Decenas de miles de descargas al día

La demanda es enorme, a prueba de ello el número de descargas, que secifran en decenas de miles diarias.

A fecha del 31 de julio de 2005, se cuenta con 37.532 archivosdescargados al día, 243.808 archivos a la semana y 1.154.765 archivosal mes.

A fecha del 6 de mayo de 2007, se cuenta con 89.841 archivosdescargados al día, 697.818 archivos a la semana y 2.995.436 archivosal mes.

A fecha del 15 de noviembre de 2010, se cuenta con 130.524 archivosdescargados al día, 888.520 archivos a la semana y 3.582.153 archivosal mes.

Y esto sólo concierne el sitio web de descargas principal, en la Universidad de Carolina del Norte, Estados Unidos), quealberga también el sitio web del Proyecto Gutenberg. El segundo sitioweb de descargas es el del Internet Archive, que también sirve de copiade seguridad y le proporciona alProyecto Gutenberg une capacidad de almacenamiento ilimitada.

Un Top 100 inventaria los cien títulos y los cien autores que más hansido descargados durante el día, la semana y el mes.

El Proyecto Gutenberg dispone de 40 sitios web espejo repartidos entoda la planeta, y aún necesita encontrar otros. Los archivos tambiéncirculan en modo P2P (peer-to-peer), lo que permite a cualquierutilizador intercambiar directamente archivos con otro utilizador.

Los libros del Proyecto Gutenberg pueden ayudar a colmar la fracturadigital. Es muy sencillo descargarlos en un ordenador o un dispositivomóvil de segunda mano que no cuestan más de unos dólares o decenas dedólares.

# Hacia el futuro

Más adelante, quizás se pueda contemplar la idea de una traducciónsimultánea a unos cien idiomas, utilizando un programa de traducciónautomática con un margen de fiabilidad del orden de 99% en el futuro.Los textos generados por el software de traducción automática pasaríanluego en manos de traductores (no máquinas, sino seres humanos) parahacerles algunos retoques, siguiendo un modelo parecido al de latecnología OCR, que no puede prescindir de los correctores (no de lossoftware, sino de los seres humanos) para ofrecer un contenido decalidad óptima.

Cuarenta años después de la creación del Proyecto Gutenberg, MichaelHart se define aún como un adicto al trabajo que sigue dedicándoseenteramente a su proyecto, proyecto que en su opinión está al origen deuna revolución neo-industrial. Se define también a sí mismo como unaltruista, pragmático y visionario. Tras haber sido tildado de chifladodurante años, ahora suscita el respeto.

Con el pasar de los años, la misión del Proyecto Gutenberg nunca hadejado de ser la misma, a saber la de cambiar el mundo mediante elebook gratuito, de uso infinito y repetible. El objetivo también siguesiendo el mismo, es decir la lectura gratis y la cultura para todos.

En cuanto a la misión, se resume en pocas palabras: "fomentar lacreación y la distribución de los ebooks", por cuantas personas seaposible, por todos los medios posibles, y aceptando también los virajesnecesarios para integrar nuevas ideas, nuevos métodos y nuevossoportes.


Les résultats du Projet Gutenberg ne se mesurent pas seulement à deschiffres. Les résultats se mesurent aussi à l‘influence du projet, quiest considérable.

# D'autres bibliothèques numériques

Premier site d‘information sur l‘internet et première bibliothèquenumérique, le Projet Gutenberg inspire bien d‘autres bibliothèquesnumériques au fil des ans, à commencer par le Projekt Runeberg pour lalittérature scandinave et le Projekt Gutenberg-DE pour la littératureallemande.

Le Projekt Runeberg est la première bibliothèque numérique suédoise delivres du domaine public, créée en décembre 1992 par Lysator, un clubinformatique d‘étudiants, en collaboration avec la bibliothèque del'Université de Linköping (Suède). Le but est de produire et organiserdes versions électroniques gratuites de la littérature nordiqueclassique. 200 oeuvres sont disponibles en 1998, avec une liste de6.000 auteurs nordiques en tant qu'outil de développement descollections.

Projekt Gutenberg-DE est la première bibliothèque numérique allemandede livres du domaine public.

Plusieurs dizaines de textes peuvent êtrelus en ligne en 1998, avec une page web pour les textes courts etplusieurs pages – une par chapitre – pour les oeuvres plus longues. Uneliste alphabétique d'auteurs et de titres est également disponible,ainsi qu'une courte biographie et bibliographie pour chaque auteur.

# Une structure aussi simple que possible

La structure administrative et financière du Projet Gutenberg se limiteau strict minimum, avec une devise qui tient en trois mots: «Less ismore». Michael Hart insiste régulièrement sur la nécessité d‘un cadreaussi souple que possible laissant toute initiative aux volontaires, etla porte grande ouverte aux idées nouvelles.

Le but est d‘assurer lapérennité du projet indépendamment des crédits, des coupures de créditset des priorités culturelles, financières et politiques du moment. Pasde pression possible donc par le pouvoir et par l‘argent. Et respect àl‘égard des volontaires, qui sont assurés de voir leur travail utilisépendant de nombreuses années. Le suivi régulier du projet est assurégrâce à une lettre d‘information hebdomadaire et mensuelle, des forumsde discussion, des wikis et des blogs.

Les dons servent à financer des ordinateurs et des scanners, et àenvoyer des CD et DVD gratuits à tous ceux qui en font la demande.Suite au CD Best of Gutenberg disponible en août 2003 avec unesélection de 600 titres, un premier DVD est disponible en décembre 2003avec 9.400 titres, suivi d'un deuxième DVD

disponible en juillet 2006avec 17.000 titres. A partir de 2005, CD et DVD sont disponibles sousforme d'images ISO sur le site de BitTorrent, ces images pouvant êtretéléchargées pour graver des CD et DVD sur place à titre personnel. En2007, le Projet Gutenberg envoie 15 millions de livres par voie postalesous forme de CD et DVD.

Chose souvent passée sous silence, Michael Hart est le véritableinventeur de l‘ebook. Si on considère l‘ebook dans son sensétymologique, à savoir un livre numérisé pour diffusion sous forme defichier électronique, celui-ci serait né avec le Projet Gutenberg enjuillet 1971, trente ans avant les divers lancements commerciaux ayantémaillé le début des années 2000 avec les ebooks d'Amazon, Barnes

&Noble, Gemstar et autres.

# Des dizaines de milliers de téléchargements par jour

La demande est énorme. En témoigne le nombre de téléchargements, qui secomptent en dizaines de milliers par jour.