DMOZ

Van Wikipedia, de gratis encyclopedie
Spring naar navigatie Spring naar zoeken
Globus-Icon der Infobox
Directoryproject openen
Website-logo
Mensen doen het beter
Webdirectory
talen meertalig
Online 1998-17. maart 2017
www.dmoz.org [1]
Curlie-logo

Het Open Directory Project ( ODP ), ook bekend als dmoz (voor "Directory Mozilla"), was de grootste door mensen bewerkte webdirectory op het World Wide Web . [2] De inhoud van het project is gratis en is bewerkt en bijgewerkt door vrijwillige redacteuren , de zogenaamde redacteuren.

Op 28 februari 2017 werd aangekondigd dat de telefoongids op 17 maart 2017 zou worden gesloten door de exploitant AOL . [3] Over de redenen is niets bekendgemaakt. [4] [5]

Het vervolgproject is ontwikkeld onder de naam Curlie en staat sinds eind 2017 online. [6] Het domein curlie.org heeft op 2 november 2020 een Alexa Rank van 66 806. [7]

verhaal

Van "Gnuhoo" naar het "Open Directory Project"

De ODP werd oorspronkelijk opgericht onder de naam Gnuhoo en ging op 5 juni 1998 online. De naam werd later veranderd in Newhoo nadat een Slashdot- artikel aangaf dat Gnuhoo niet gebaseerd was op vrije software en dat Gnuhoo het handelsmerk van het GNU- project zonder toestemming gebruikte. [8e]

Newhoo werd het Open Directory Project nadat het in oktober 1998 door Netscape was gekocht en de inhoud ervan onder een Open Content- licentie had gepubliceerd. In november 1998 werd Netscape inclusief de ODP gekocht door AOL , dat in 2000 fuseerde met Time Warner . De korte vorm "Dmoz" of "dmoz.org" is afgeleid van het eerste hostingadres directory.mozilla.org.

Op 20 oktober 2006 ondervond de ODP ernstige technische problemen. De functies voor het voorstellen van links en wijzigingen evenals de interne bewerkingsfuncties voor het wijzigen van catalogusitems waren geblokkeerd. Op 18 december 2006 werd de toegang voor redacteuren weer vrijgegeven; op 13 januari 2007 de publieke interface voor het voorstellen van sites en wijzigingen en op 23 februari 2007 de mogelijkheid om de nieuwe editor aan te vragen.

motivatie

De motivatie voor de oprichting van de ODP was de frustratie over het gebrek aan actualiteit, dat wil zeggen de lange vertraging bij het opnemen van nieuwe sites en het hoge percentage dode links in redactioneel onderhouden directories. Maar ook kritiek om internet steeds meer te commercialiseren en te reduceren tot een reclamemedium in plaats van vrije toegang tot informatie een hogere prioriteit te geven.

Ervan uitgaande dat mensen superieur zijn aan geautomatiseerde catalogus- en zoeksystemen, zou de gebruiker een kwalitatief beter, beknopter zoekresultaat moeten krijgen. De uitdrukking hiervoor was de slogan Mensen doen het beter om het te onderscheiden van concepten van geautomatiseerde zoekmachines.

Er was echter ook kritiek op de gebrekkige tijdigheid en lange doorlooptijd van het ODP. De vertraging bij opname was in veel categorieën vergelijkbaar met wat voorheen gebruikelijk was bij Yahoo! De redactiegemeenschap had moeite om gelijke tred te houden met de groei van internet en veel van de categoriebranches hadden geen redacteuren om het grote aantal registraties aan te kunnen.

Navolgers

Het idee inspireerde ten minste twee andere webdirectories , ook gefinancierd door particuliere bedrijven en bewerkt door vrijwillige redacteuren: The Go Directory (voorheen beheerd door Disney ) en Zeal (gekocht door LookSmart ). Beide zijn inmiddels stopgezet. Geen van deze mappen publiceerde hun gegevens echter als open inhoud .

structuur

Het Open Directory Project was gebaseerd op een geclassificeerde boomstructuur in het hypertext-systeem. Vanuit het oogpunt van de oorsprong werden categorieën thematisch of regionaal afgeleid en geërfd tot aan de subcategorieën in 89 talen en dialecten (vanaf juni 2014). Elke inzending kan worden toegewezen aan een geschikte categorie op basis van de hoogste relevantie voor een onderwerp of regio. Meerdere inzendingen waren ook mogelijk als ze op meerdere plaatsen relevant waren.

gebruik van gegevens

De ODP-inhoud was gratis toegankelijk voor het publiek. Daarnaast werd een gratis gebruiksrecht verleend voor verdere verspreiding als gehele of gedeeltelijke publicatie. [9] De gegevens waren beschikbaar om te downloaden in een vroege vorm van het RDF- formaat. Elke week kwam er een nieuwe versie uit. De gegevens van de op zichzelf staande ODP-set (dump) bevatten zowel de URL-items als de directorystructuur inclusief de koppelingen tussen categorieën.

De gegevens zijn verspreid onder de licentievoorwaarden van Open Directory Project. Deze voorzagen in een zichtbare ODP-bron met links voor het voorstellen van nieuwe vermeldingen en voor het aanvragen om met de ODP te werken op elke afzonderlijke pagina die de inhoud van de ODP bevat. [10] Door deze regeling werd de inhoud vaak overgenomen van andere sites. Google gebruikte tot 2011 onder meer de Dmoz-gegevens voor zijn eigen webdirectory. [11]

Editors

Het ODP omschreef zichzelf als een project van vrijwillige redacteuren die systematisch op internet gepubliceerde informatie catalogiseren en openbaar maken. Redacteuren zijn alleen verantwoordelijk voor bepaalde categorieën en branches. Hiertoe werden bij consensus zoveel mogelijk verschillende redacteuren, elk met de beste kennis op een bepaald vakgebied en interessegebied, toevertrouwd.

Ondanks de mogelijkheid om pagina's te suggereren, groeide de directory vooral door eigen onderzoek door redacteuren. Dit omvatte ook transversale activiteiten zoals het creëren van nieuwe subcategorieën, het verplaatsen van items naar meer geschikte categorieën en het bijwerken van items en opmerkingen.

De community van redacteuren is opgebouwd

  • de openbaar beschikbare richtlijnen
  • Vertrouwen in de competentie, verantwoordelijkheid en betrouwbaarheid van het individu
  • een principe van meervoudige controle, met onderlinge afstemming van twijfelgevallen en bij het opleiden van nieuwe redacteuren
  • Hulp van redacteuren op een hoger niveau (meta-editors) en beheerders

Aan. Naast het onderhouden van de bestaande database, bestond het werk van redacteuren vooral uit het publiceren van nieuwe inzendingen in de categorie waar ze aan werkten. Deelname aan vrije tijd was niet verplicht en niet gebonden aan vaste tijden.

Het aanvraagproces als nieuwe redacteur of voor nieuwe categorieën en uitbreiding van de bewerkingsrechten omvatte drie voorbeeldlinks en beschrijvingen, evenals vragen over het onderwerp. [12] Kwaliteit en het voorkomen van misbruik spelen een doorslaggevende rol, ook vanwege de overdracht van de data onder open licentie aan andere datagebruikers. Een minimale vooropleiding of referenties of iets dergelijks waren niet vereist.

Net zoals redacteuren hun rechten konden neerleggen en de ODP konden verlaten, zouden actieve redacteuren op korte termijn van het project kunnen worden uitgesloten als de richtlijnen werden geschonden vanwege misbruik, onbetrouwbaarheid en onverantwoordelijk gedrag.

Data-acquisitie en onderhoud

DMOZ-inzendingen bestonden uit een korte titel (meestal de naam van de website of het bedrijf) en een korte beschrijving van de inhoud, het aanbod en de bijzonderheden van een website.

De opnamecriteria zijn ongewijzigd gebleven sinds de start van de directory. De inzending moet vergezeld gaan van een informatief, classificeerbaar, serieus en relevant informatieaanbod met een eigen inhoud op een website. De informatie-inhoud van een website werd bepaald door de mate van de eigen inhoud in relatie tot advertenties (banners, Adwords, Adlinks), extern geïntegreerde pagina's en informatie gekopieerd van andere pagina's. Websites die geweld verheerlijken, racistisch, pornografisch zijn of aanzetten tot criminele handelingen zijn niet opgenomen in of verwijderd uit de database. [13]

Daarnaast waren er een aantal mechanismen en instrumenten die zijn ontworpen om de gegevenskwaliteit en de relevantie van categorieën te verbeteren en misbruik uit te sluiten. Hiervoor was in elke categorie een formulier beschikbaar voor externe inclusiesuggesties, één voor het bijwerken van verzoeken voor bestaande inzendingen en één voor het controleren van vermoedens van misbruik (door meta-editors).

Naast het werk van de redacteuren, werd de eigen webcrawler van het bedrijf, genaamd Robozilla, met tussenpozen over alle vermeldingen in de directory gestuurd om dode, beschadigde of verdachte links te vinden. Robozilla heeft ze tijdelijk uit de directory verwijderd en gemarkeerd voor beoordeling door redacteuren die verdere actie kunnen ondernemen.

Vermeldingen van verlopen domeinen werden grotendeels automatisch uit de directory verwijderd om ervoor te zorgen dat ze up-to-date waren en om valse of misleidende inhoud door het kapen en "parkeren" van internetadressen te voorkomen.

In de loop van de tijd nam het aantal vaste medewerkers dat door Netscape en AOL aan het project werd toegewezen voortdurend af. Dit werd gecompenseerd door een aantal tools die door de redactie zijn gemaakt en in overleg met de administratie zijn ingevoerd. Om het werk gemakkelijker te maken zijn er linkcheckers, gespecialiseerde webcrawlers , spellingcheckers, verbeterde zoekmachines en een aantal bookmarklets voor redacteuren gemaakt.

Uitbesteding

Redacties zijn in de loop der jaren autonoom een ​​aantal verwante projecten gestart, waarvan sommige gebaseerd zijn op de software die ook door het ODP wordt gebruikt. Geen van deze is tot dusver echter zo succesvol geweest als de ODP zelf.

Een van deze projecten werd rechtstreeks in het ODP geïntegreerd als een directory in de directory: De branche voor kinderen en jongeren, kidmoz . Daar werden speciaal voor de doelgroep kinderen en jongeren geselecteerde sites voorzien van passende beschrijvingen en leeftijdsinformatie en vermeld. Organisatorisch was dit deel van de directory relatief onafhankelijk, ook al waren de richtlijnen die voor beide directory's golden en in beide directory's een aantal redacteuren actief. Het werd opgericht in november 2000. [14]

Een ander project dat gespecialiseerd is in het verzamelen van alle gegevens met betrekking tot muziek en muzikanten is MusicMoz . Deze bestaat momenteel alleen in het Engels, maar een Duitstalige tak is in voorbereiding.

feiten en cijfers

Aantal inschrijvingen in het Duitstalige deel van de ODP

Op 31 januari 2014 registreerde de ODP meer dan 4,2 miljoen inzendingen (waarvan bijna 500.000 in het Duitstalige deel van de catalogus), gesorteerd in meer dan 1.000.000 categorieën. In januari 2016 waren er iets minder dan 4 miljoen inzendingen, het totale aantal redacteuren was meer dan 90.000. In juli 2016 waren er 3.938.044 inzendingen van in totaal 91.441 redacteuren.

De basis voor het opnemen en onderhouden van inzendingen waren de publiek toegankelijke richtlijnen en instructies en of een pagina-informatie voor het onderwerp nuttig en een waardevolle toevoeging is. [13]

In september 2019 registreerde Curlie.org 3.444.397 pagina's (426.509 daarvan in het Duitstalige deel van de catalogus) in 91 talen en 1.033.965 categorieën van in totaal 92.019 redacteuren. [15]

web links

Vervolgprojecten

Individueel bewijs

  1. www.dmoz.org ( Memento van 14 november 2017 in het internetarchief )
  2. dmoz.org ( Memento van 11 oktober 2016 in het internetarchief )
  3. op dmoz.de. Ontvangen 17 oktober 2018 .
  4. Dmoz wordt gesloten - WebABC.info . In: WebABC.info . 2 maart 2017 ( webabc.info [geraadpleegd op 23 maart 2017]).
  5. ^ RIP DMOZ: Het Open Directory Project wordt afgesloten . In: Zoekmachineland . 28 februari 2017 ( searchengineland.com [heeft toegang gekregen tot 1 maart 2017]).
  6. Het vervolgproject Curlie staat online. Ontvangen 9 december 2017 .
  7. Alexa Rank van curlie.org, november 2020
  8. Slashdot: The GnuHoo BooBoo ( Memento van 28 februari 2014 in het internetarchief )
  9. ^ Articles of Association ( Memento van 21 oktober 2016 in het Internet Archive ) van Netscape met vrijwillige verbintenissen van de web community
  10. Open Directory-licentie ( Memento van 20 oktober 2016 in het internetarchief )
  11. Herbert Braun: Google sluit zijn labs. In: Heise-ontwikkelaar. 21 juli 2011, geraadpleegd op 30 juli 2011 : “Tegelijkertijd heeft Google stilzwijgend zijn Google Directory-webcatalogus gesloten. Deze dienst, die elf jaar geleden werd gelanceerd als concurrent van de Yahoo-catalogus, heeft gegevens uit de dmoz-directory van Netscape geüpgraded met een rangorde binnen de categorieën."
  12. Vragen en antwoorden over solliciteren als redacteur bij het Open Directory Project ( Memento van 18 oktober 2016 in het internetarchief )
  13. a b Open Directory: Richtlijnen voor het bewerken ( Memento van 18 oktober 2016 in het internetarchief )
  14. Nieuwsbrief maart 2001 ( Memento van 1 maart 2017 in het internetarchief ) met een presentatie van het nieuwe project
  15. curlie.org