Internetarchief

Van Wikipedia, de gratis encyclopedie
Spring naar navigatie Spring naar zoeken
Globus-Icon der Infobox
Internetarchief
Website-logo
"Universele toegang tot alle kennis"
Webarchivering /
Digitale bibliotheek
talen Engels
Stoel San Francisco , Californië , Verenigde Staten Verenigde Staten Verenigde Staten
oprichter Brewster Bald
operator Internetarchief
redactie Brewster Bald
Registratie optioneel
Online 1996
https://archive.org/

Het internetarchief in San Francisco is een non- profitproject dat in 1996 werd opgericht door Brewster Kahle en sinds 2007 de officiële bibliotheekstatus heeft. Het is begonnen als een puur webarchief , waar je gearchiveerde websites kunt bekijken met de zogenaamde Wayback Machine . Al in 1999 werd het uitgebreid met extra archieven, zodat het nu een digitale bibliotheek is die een aanzienlijke verzameling teksten en boeken, audiobestanden, video's, afbeeldingen en software bevat. Het Internetarchief heeft zich tot taak gesteld digitale gegevens langdurig te archiveren in een vrij toegankelijke vorm en hecht groot belang aan toegangsmogelijkheden voor blinde of anderszins beperkte gebruikers.

Naast zijn functie als archief ziet het Internetarchief zichzelf ook als activist voor een open en vrij internet en het bewaren en verspreiden van werken in het publieke domein . [1]

Oorsprong en geschiedenis

Brewster Kahle , oprichter van Alexa Internet en het internetarchief (2015)
Spiegelserver met de gegevens uit San Francisco in de Egyptische Bibliotheca Alexandrina

Brewster Kahle richtte in mei 1996 het internetarchief op als een non-profitorganisatie op grond van sectie 501 (c) (3) van de Amerikaanse wet op de inkomstenbelasting . Vanaf het begin ontving het een grote hoeveelheid gegevens van Alexa Internet . Als onderdeel van webarchivering slaat het zogenaamde mementos op , d.w.z. snapshots van websites en Usenet- berichten. [2]

Vanaf 1999 werd het doel uitgebreid met een uitgebreide, vrij toegankelijke bibliotheek door de opname van het Prelinger Archief en later andere collecties. Het internetarchief bevat begin 2021 een collectie van ruim 28 miljoen boeken en teksten, zes miljoen video's en films, 14 miljoen audiobestanden, 580.000 computerprogramma's en 3,5 miljoen beeldbestanden. Het webarchief van Wayback Machine bevat nu meer dan 475 miljard webpagina's. [2]

Voor 2014 meldde het project dat de gegevens zouden worden opgeslagen in vier datacenters op 20.000 harde schijven . Een mirrorserver van de gegevens uit San Francisco staat in de Egyptische Bibliotheca Alexandrina . Begin 2021 bereikte de collectie een omvang van ruim 45 petabyte . [3]

Het archief is sinds begin mei 2007 officieel erkend als bibliotheek door de Amerikaanse staat Californië . [4]

Volgens een verklaring op haar website is het internetarchief sinds de verkiezingen van 8 november 2016 van plan om een ​​permanent bijgewerkte kopie in Canada te bewaren. [5]

Diensten

webarchief

Wayback Machine-logo

De Wayback Machine ("Take Me Back") is een online dienst waarmee de opgeslagen webpagina's in verschillende versies kunnen worden opgeroepen. De pagina's die moeten worden opgeslagen, worden geselecteerd via de Alexa-internetservice . Alle daar opgeslagen URL's worden regelmatig opgeroepen en gearchiveerd. Een internetbron die nog niet is opgeslagen, kan ook handmatig worden opgenomen door de pagina op te zoeken en vervolgens de opname te bevestigen (bestandsinhoud, bijv. JPG- afbeeldingen, worden zonder voorafgaand verzoek opgeslagen). Het totale volume bedroeg ongeveer 150 miljard pagina's in november 2009 en groeide tot meer dan 273 miljard pagina's in oktober 2016.

In 2006 was Archive-It een andere webarchiefdienst voor individuele webarchivering. Instellingen en particulieren hebben de mogelijkheid om digitale back-ups van hun collecties te maken en zelf de vrijgave van de gegevens te bepalen. Archive-It heeft 400 partners uit 16 landen over de hele wereld, voornamelijk van universiteiten, staatsarchieven, musea en kunstbibliotheken, openbare bibliotheken en andere openbare instellingen en NGO's . Archive-It biedt deelnemende partners een full-text search naar hun content, maar ook de mogelijkheid om gestructureerde datasets verrijkt met metadata voor onderzoekers te exporteren. [6]

De opname van het Prelinger-archief [7] in 1999 was de eerste uitbreiding van het internetarchief die verder ging dan webarchivering. Tegenwoordig bevat het ruim drie miljoen video's en films die onder een vrije licentie of in het publieke domein vallen. Ook wordt hier gewerkt aan een archief voor televisieprogramma 's.

Tekstarchief

In het Million Book Project zullen via het Internet Archive boeken worden geplaatst die door het verstrijken van het auteursrecht (Amerikaanse copyrightwet ) of anderszins in het publieke domein zijn gedigitaliseerd en beschikbaar zijn gesteld om te downloaden. De digitale exemplaren zijn onderdeel van de Open Bibliotheek . Inmiddels zijn er meer dan tien miljoen boeken en teksten gearchiveerd.

Er zijn meerdere scancentra (twaalf in 2009), bijvoorbeeld in Richmond . Er wordt per bestelling gescand en er wordt tien dollarcent per pagina in rekening gebracht (vanaf 2009). De klanten, meestal bibliotheken, ontvangen het gedigitaliseerde materiaal, een tekstbestand gegenereerd door OCR , een permanent internetadres en de mogelijkheid om het gedigitaliseerde materiaal op de servers van de vereniging op te slaan. [8] Ook zijn er samenwerkingsovereenkomsten met zelfdigitaliserende bibliotheken voor losse diensten zoals OCR en redundante hosting.

Software-archief

De Library of Congress heeft in december 2006 zes uitzonderingen toegestaan ​​op de Digital Millennium Copyright Act . [9] Het Internet Archive kan dus save computer software of spellen die zijn geworden abandonware [10] met de bedoeling van het behoud van hen als de oorspronkelijke hardware, formats of technologie zijn verouderd. In 2013 begon het internetarchief met het aanbieden van klassieke games als een speelbare webbrowser - streaming via MESS- emulatie [11] , bijv. B. de Atari-2600- videogame ET the Extra-Terrestrial . [12] Vanaf 23 december 2014 zullen duizenden klassieke DOS- computerspellen worden gepresenteerd voor onderwijs- en onderzoeksdoeleinden [13] met behulp van DOSBox- emulatie in de browser. [14] [15] [16] [17]

Internetarchief in San Francisco (1996-2009)
Nieuw hoofdkantoor van het internetarchief sinds november 2009 in een voormalige " Christian Science "-kerk
Internetarchief in de Bibliotheca Alexandrina . Achter de ruiten bevinden zich de rekken met de archiefcomputers.
Video van een demonstratie van de digitaliseringstechnologie van het internetarchief door Brewster Kahle, 29 maart 2013.

Audioarchief

Het audioarchief bevat sinds 2017 al meer dan drie miljoen geluidsopnames . Deze variëren van radio-uitzendingen en radio is voorzien om audio boeken , poëzie , live concert opnames en muziek die door de gebruikers zijn geupload. Het archief kan ook worden gebruikt om podcasts te publiceren. [18]

Beeldarchief

In het beeldarchief zijn al meer dan 1¼ miljoen beeldbestanden beschikbaar. Dit zijn afbeeldingen van kunstwerken , er is een collectie afbeeldingen van het Metropolitan Museum of Art met meer dan 100.000 inzendingen, afbeeldingen van historische kaarten, astronomische opnamen van NASA , platenhoezen evenals vrij beschikbare opnamen van particulieren .

Boekenarchief - digitale scans van geciteerde boeken

Om de geloofwaardigheid van geciteerde citaten uit boeken op Wikipedia te vergroten, is er sinds 2019 een samenwerking tussen Wikipedia en het Internetarchief . Er is een begin gemaakt met het toevoegen van digitale scans van de geciteerde boeken aan de verwijzingen in Wikipedia-artikelen. [19] De betreffende passage wordt elk op twee pagina's gepresenteerd. Een voorbeeld hiervan is citaat nummer 104 [20] (per 14 november 2019) in het Engelstalige artikel over Martin Luther King .

Internetarchief geleerde

In september 2020 presenteerde het Internet Archive een initiatief voor het archiveren en aanbieden van Open Access publicaties onder de naam "Internet Archive Scholar" [21] .

Webstream-gaming

In 2013 begon het internetarchief klassieke games aan te bieden als speelbare webbrowsers - streaming via MESS- emulatie. [11]

financiering

Het Internetarchief wordt gefinancierd door donaties en subsidies van verschillende stichtingen, instituten en verenigingen op het gebied van onderwijs, onderzoek, wetenschap, etc. In april 2019 heeft het Internetarchief de volgende donateurs aangewezen: Andrew W. Mellon Foundation , Council on Library en Informatiebronnen , Democratiefonds van de Verenigde Naties , Federal Communications Commission Universal Service Program for Schools and Libraries (E-Rate) , Institute of Museum and Library Services (IMLS) , Knight Foundation , Laura and John Arnold Foundation , National Endowment for the Humanities (Office of Digital Humanities) , National Science Foundation , The Peter and Carmen Lucia Buck Foundation , The Philadelphia Foundation , Rita Allen Foundation . [2]

Zie ook

literatuur

  • Alexis Rossi: Federale diversiteit - wereldwijde netwerken: strategieën van de deelstaten voor cultureel erfgoed in de digitale wereld . Red.: Hamburg University Press, Verlag der Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky (= cultureel erfgoed in de digitale wereld ). 1e editie. Hamburg 2016, ISBN 978-3-943423-34-1 , Internetarchief, p.   224-237 ( oopen.org ).

web links

Commons : Internetarchief - verzameling afbeeldingen, video's en audiobestanden

Individueel bewijs

  1. ^ Internet Archive, Prelinger Archives en Project Gutenberg Literary Archive Foundation. In: harvard.edu. Geraadpleegd op 27 februari 2021 .
  2. a b c Over het internetarchief. In: archief.org. Geraadpleegd op 10 februari 2021 .
  3. Petabox. In: archief.org. Geraadpleegd op 27 februari 2021 .
  4. ^ Internet Archive officieel een bibliotheek. Internetarchiefforum. In: archief.org. 25 juni 2007, geraadpleegd 2021 .
  5. ^ Brewster Kahle: Help ons het archief gratis, toegankelijk en voor de lezer privé te houden. Internetarchiefblogs. In: archief.org. 29 november 2016, geraadpleegd op 21 april 2017 .
  6. Over Archive-It. In: archive-it.org. Geraadpleegd op 23 maart 2021 .
  7. Tim Brookes: Prelinger-archieven: duizenden oude films om te bekijken, te remixen en te gebruiken in je eigen projecten (dingen om te bekijken). In: makeuseof.com. 30 juli 2012, geraadpleegd op 29 oktober 2016 .
  8. Christoph Drösser: Het digitale Alexandrië. In: Die Zeit 2008, nr. 4, 17 januari 2008, geraadpleegd op 23 maart 2021 .
  9. Internet Archive wint uitstel van auteursrecht. In: theregister.co.uk. Het register, 1 december 2006, geraadpleegd op 23 maart 2021 .
  10. Ross Miller: US Copyright Office verleent leaveware-rechten ( Engels ) In: joystiq.com . Opgehaald op 7 februari 2013. @ 1 @ 2 Sjabloon: Toter Link / www.joystiq.com ( pagina niet langer beschikbaar , zoek in webarchief )
  11. ^ Een b Tilman Baumgärtel: Timothy Leary, de spelletjes ontwikkelaar . In: zeit.de. Tijd online . 14 november 2013. Ontvangen 14 november 2013: “Hoe kom je aan historische computerspellen? Het internetarchief streamt tientallen klassiekers en Timothy Leary bereidt games voor op onderzoek in New York - omdat het internetarchief games 'streamt', d.w.z. je laadt ze niet op je eigen computer, je schendt de auteursrechtwetgeving niet, gebruikt de programma's."
  12. Adi Robertson: The Internet Archive plaatst Atari-spellen en verouderde software rechtstreeks in uw browser ( Engels ) In: The Verge . 25 oktober 2013. Ontvangen op 29 oktober 2013.
  13. Gebruiksvoorwaarden, privacybeleid en copyrightbeleid van Internet Archive ( Engels ) archive.org. 31 december 2014. Ontvangen op 8 januari 2015: "Toegang tot de collecties van het archief wordt u gratis verleend en wordt alleen verleend voor studie- en onderzoeksdoeleinden."
  14. Abby Ohlheiser: Je kunt nu bijna 2.400 MS-DOS-videogames spelen in je browser ( Engels ) In: The Washington Post . 5 januari 2015. Ontvangen op 8 januari 2015.
  15. Elke nieuwe laars een wonder door Jason Scott (23 december 2014)
  16. collectie: softwarelibrary_msdos in het internetarchief (29 december 2014)
  17. Kris Graft: Het opslaan van de geschiedenis van videogames begint nu . Gamasutra. 5 maart 2015. Ontvangen op 5 maart 2015.
  18. Podcast MP3 hosten op Archive.org . In: Turbo Toekomst . ( turbofuture.com [geraadpleegd op 4 augustus 2017]).
  19. ^ Süddeutsche Zeitung: Fotobewijs. Ontvangen 14 november 2019 .
  20. ^ Drew Hansen: The Dream: Martin Luther King Jr. en de toespraak die een natie inspireerde . HarperCollins, 2005, ISBN 978-0-06-008477-6 , blz. 98 .
  21. Internetarchief: hoe het internetarchief zorgt voor permanente toegang tot open access tijdschriftartikelen. 15 september 2020, geraadpleegd op 24 oktober 2020 .

Coördinaten: 37 ° 46 ′ 56.3" N , 122 ° 28 ′ 17.6" W.