statistieken

Van Wikipedia, de gratis encyclopedie
Spring naar navigatie Spring naar zoeken

Statistiek "is het aanleren van methoden voor het omgaan met kwantitatieve informatie" ( data ). [1] Het is een manier om "een systematisch verband te leggen tussen ervaring ( empirisme ) en theorie". [1] Statistieken zijn de samenvatting van bepaalde methoden voor het analyseren van empirische gegevens. Een oude term voor statistiek was collectief onderzoek . Statistiek wordt als hulpwetenschap gebruikt door alle empirische disciplines en natuurwetenschappen, zoals geneeskunde (medische statistiek), psychologie (psychometrie), politieke wetenschappen, sociologie, economie ( econometrie ), biologie ( biometrie ), scheikunde (chemometrie) en natuurkunde. Statistieken vormen daarmee de theoretische basis van al het empirische onderzoek.Omdat de hoeveelheid data in alle disciplines snel toeneemt, wint ook de statistiek en de daaruit afgeleide analyse van deze data aan belang. Aan de andere kant is statistiek een tak van pure wiskunde. Het doel van pure wiskundige statistiek is om algemene uitspraken te bewijzen met de methoden van pure wiskunde. Ze maakt gebruik van kennis uit de wiskundige basisdisciplines analyse en lineaire algebra .

etymologie

Het woord statistiek komt van het Latijnse statisticum "betreffende de staat " en het Italiaanse statista staatsman of politicus , dat op zijn beurt weer van het Griekse στατίζω komt (classificeren). Duitse statistiek, geïntroduceerd door Gottfried Achenwall in 1749, verwees oorspronkelijk naar de "doctrine van gegevens over de staat". In de 19e eeuw gebruikte de Schot John Sinclair het woord voor het eerst in zijn huidige betekenis van algemene verzameling en analyse van gegevens .

invoering

Statistiek wordt enerzijds gezien als een zelfstandige wiskundige discipline over het verzamelen, analyseren, interpreteren of presenteren van gegevens, en anderzijds als een tak van de wiskunde , in het bijzonder de stochastiek . [2] [3] [4]

De statistieken zijn onderverdeeld in de volgende drie deelgebieden:

  • Beschrijvende statistiek (ook beschrijvende statistiek of empirische statistiek ): Bestaande gegevens worden op passende wijze beschreven, verwerkt en samengevat. Hun methoden worden gebruikt om kwantitatieve gegevens te condenseren in tabellen, grafieken en kengetallen. Voor sommige instellingen, zoals het geval is met officiële statistieken of het Sociaal-Economisch Panel (SOEP), is de belangrijkste taak het samenstellen van dergelijke statistieken.
  • Inductieve statistiek (ook wiskundige statistiek , sluitende statistiek , evaluatieve statistiek of inferentiële statistiek ): Bij inductieve statistiek worden kenmerken van een populatie afgeleid uit de gegevens van een steekproef . Kansrekening vormt de basis voor de benodigde schattings- en testprocedures.
  • Verkennende statistiek (ook hypothesegenererende statistiek , analytische statistiek of datamining ): Methodologisch is dit een tussenvorm van de twee bovengenoemde deelgebieden, maar wordt steeds meer een zelfstandige vorm van toepassing. Met behulp van beschrijvende procedures en inductieve testmethoden zoekt ze systematisch naar mogelijke relaties (of verschillen) tussen gegevens in bestaande databases en wil ze deze tegelijkertijd evalueren op hun sterkte en betrouwbaarheid van de resultaten. De op deze manier gevonden resultaten kunnen worden opgevat als hypothesen die alleen als statistisch veilig kunnen worden beschouwd nadat ze zijn bevestigd door inductieve testprocedures die erop zijn gebaseerd met een geschikte (toekomstige) testplanning .

Het verschil tussen beschrijvende en verkennende statistieken blijkt ook uit de vragen : [5]

  • Beschrijvende statistiek: hoe kun je een verdeling van een kenmerk beschrijven?
  • Verkennende statistiek: wat is opmerkelijk of ongebruikelijk aan een verdeling van een kenmerk?

verhaal

Moderne statistiek is voortgekomen uit verschillende historische ( data-analytische ) ontwikkelingen die in de loop van de 19e en 20e eeuw samengroeiden tot de statistieken van vandaag. Met name de verdeling van de statistieken in een beschrijvende en een sluitende statistiek weerspiegelt deze historische ontwikkeling.

officiële statistieken

Het begin van officiële statistieken gaat terug tot ver voor de geboorte van Christus. De eerste officiële statistieken waren tellingen (waarschijnlijk de eerste keer in Egypte rond 2700 voor Christus [6] , tijdens de Xia-dynastie rond 2000 voor Christus, in de stad Mari in Mesopotamië rond 1700 voor Christus). In het oude Griekenland, althans in Athene, waren er burgerlijke registers, registers van bevolkingsbewegingen, invoerlijsten van goederen die aan rechten waren onderworpen (zoals de invoer van graan) en eigendomsregisters. De burgers en hun eigendommen werden geregistreerd in Romeinse volkstellingen.

In Duitsland vond in 1449 de eerste volkstelling plaats in Neurenberg . Het stadsbestuur wilde de bevolking en voorraden registreren om te beslissen of vluchtelingen uit de markgravenoorlog nog de stad in mochten of niet. De Franse staatsman Colbert begon in 1665 met uitgebreide (officiële) statistische onderzoeken met het opstellen van handelsstatistieken.

In Pruisen worden sinds 1683 in opdracht van keurvorst Friedrich Wilhelm bevolkingsstatistieken (geboorten, huwelijken en overlijdens) opgesteld en in de loop van de tijd uitgebreid: in 1719 de huishoudinventaris en gemeentefinanciën, in 1778 de veestapel, zaai, graanprijzen, vlas en tabaksteelt, fabrieken, ijzerfabrieken en mijnen, scheepvaart en handel. Andere Duitse staten en steden volgden, bijvoorbeeld Beieren in 1771 met de Dachsberg-volksbeschrijving. Sinds de oprichting van het Bureau voor de Statistiek van het Duitse Rijk in 1872 worden alle officiële statistieken in Duitsland bijgehouden. [7] Ook in Oostenrijk hield Maria Theresa in 1753 een eerste volkstelling.

Tegen 1870 hadden de meeste grote staten in Europa moderne statistische autoriteiten. Op de conferenties van het Statistisch Congres (1853-1878) werden kwaliteitsnormen geformuleerd die de meeste staten hanteerden. [8e]

In tegenstelling tot de huidige resultaten van officiële statistieken , werden de geproduceerde statistieken niet gepubliceerd en beschouwd als staatsgeheimen.

Universitaire statistieken

Onafhankelijk van de officiële statistieken, de zogenaamde universiteitsstatistieken, heeft zich een term voor beschrijvende maatschappijleer en regionale studies ontwikkeld die nu nauwelijks meer wordt gebruikt. De compilatie van de Italiaanse Sansovino (1562) is een eerste opsomming van de regeringsvormen van twintig staten. [9] Soortgelijke werken werden gemaakt door de Italiaan Botero (1589), de Fransman d'Avitys (1616) en de Nederlander de Laet (1624-1640). [10] De belangrijkste vertegenwoordiger van universitaire statistieken in Duitsland was de statisticus Achenwall .

Officiële statistieken werden gebruikt voor administratie en ter ondersteuning van regerings- of administratieve beslissingen. Universitaire statistieken waren bedoeld als een meer algemene bron van informatie voor staatslieden en bevatten aanvankelijk alleen tekstuele beschrijvingen. Dit omvatte de vorm van de regering, wettelijke bepalingen en individuele feiten, gewoon "staatskenmerken" in de zin van het vermelden waard . Tabellen werden pas later toegevoegd, zoals bij Büsching het geval was. De universitaire statistici voerden zelf geen enquêtes uit, maar verwerkten en publiceerden ze via toegang tot de officiële statistieken.

De 19e eeuw bracht verfijningen in observatiepraktijken, hun institutionele bestendiging en het idee van objectivering. Aan het einde van de 19e eeuw werd de term ' bevolking ' steeds meer gebruikt. Volledig ontwikkelde wiskundige statistieken waren beschikbaar tot 1890. Sinds het midden van de eeuw doet Adolphe Quetelet onderzoek naar sociale cijfers op basis van gemiddelden, correlaties en wetten en bedacht hij de 'statistische gemiddelde burger' ( l'homme moyen ). [11]

politieke rekenkunde

Het waren alleen de politieke rekenkundigen die begonnen te zoeken naar wetten in de data. Dit vond zijn oorsprong in de steeds populairder wordende tontines , een soort pensioenverzekering. [12] De Engelsman Graunt analyseerde geboorte- en overlijdenslijsten in 1660 en wilde algemene wetten vinden over de geslachtsverhouding, de verhouding tussen sterfgevallen en geboorten en de frequentie van sterfgevallen. [13] De Engelse statisticus en econoom Petty paste dit type analyse toe op economische gegevens. De belangrijkste vertegenwoordiger van de politieke rekenkunde in Duitsland is de statisticus Sussmilch met zijn werk The Divine Order in the Relationships of the Human Sex, from Birth, Death and Reproduction of the Same Proven uit 1741.

Dit soort statistieken beïnvloedde ook filosofische vragen, zoals het bestaan ​​van de vrije wil van het individu. [14] Quetelet ontdekte dat het aantal huwelijken in Belgische steden minder afwijkt van het gemiddelde dan het aantal sterfgevallen. En dat hoewel de tijd van het huwelijk onderhevig is aan de vrije wil en het tijdstip van overlijden (meestal) niet.

kansberekening

De moderne kansberekening is ontstaan ​​uit overwegingen van kansspelen. De correspondentie tussen Pascal en Fermat in 1654 wordt beschouwd als het geboorteuur van de kansrekening.De basis van de moderne kansrekening werd voltooid met de publicatie van Kolmogorovs leerboek Basic Concepts of the Calculus of Probabilities in 1933.

Stappen in de praktische implementatie van de statistieken

Een statistisch onderzoek wordt altijd uitgevoerd in het samenspel van statistisch-wiskundige methodiek en theoretische specialistische kennis. Het kan grofweg worden onderverdeeld in vijf stappen:

planning

In de planfase (of ook de definitiefase) moeten de onderzoeksvragen (probleem en doel van het onderzoek en hun theoretische onderbouwing) helder worden omschreven. Om te antwoorden moet het volgende worden besloten:

Een statistisch onderzoek is zelden een directe opeenvolging van de vijf stappen, maar meestal een constante verandering tussen de verschillende fasen, afhankelijk van de gegevens, analyseresultaten en theoretische overwegingen. Een belangrijk deelgebied is statistisch experimenteel ontwerp, waar meestal ook de zogenaamde steekproefomvangplanning (bijvoorbeeld in klinische studies) onder valt. Als dit aantal gevallen te klein is, kan het voorkomen dat het onderzoek te weinig power heeft om het verband aan te tonen. In principe kan worden gezegd dat studies met hogere case-nummers ook meer power hebben. Met behulp van statistische methoden is het mogelijk om het aantal gevallen precies te berekenen bij gebruik van een t-toets (hiermee wordt gecontroleerd of twee gemiddelde waarden van een steekproef statistisch significant van elkaar verschillen).

Verhoging

Na het bepalen van het type onderzoek zijn er bijbehorende stappen.

Primair statistisch onderzoek

De onderzoeker verzamelt zijn eigen data, bijvoorbeeld door middel van een enquête. Dit betekent dat de procedure voor het verzamelen van gegevens moet worden gedefinieerd, bijvoorbeeld via het ADM-ontwerp , en dat de verzameling moet worden uitgevoerd in overeenstemming met deze regelgeving.

Secundair statistisch onderzoek

De onderzoeker maakt gebruik van individuele gegevens die door anderen zijn verzameld, bijvoorbeeld door een statistiekbureau . Dit scheelt werk omdat hij zichzelf niet opvoed. Vaak komen de onderzochte variabelen echter niet exact overeen met de onderzoeksvraag of de gewenste operationalisering.

Tertiair statistisch onderzoek

De onderzoeker gebruikt slechts voor één statistische eenheid van ruimtelijke referentie [15] geaggregeerde gegevens die door anderen zijn verzameld en gepubliceerd.

Verder wordt onderscheid gemaakt tussen gerandomiseerde gegevens en zuivere waarnemingsgegevens (waaruit quasi-gerandomiseerde gegevens kunnen worden gegenereerd door computersimulaties, bijvoorbeeld door propensity score matching).

verwerken

De bewerkingsfase omvat het coderen van de data, de data cleansing (plausibiliteit en correctie, outliers , missing values) en eventuele (statistische of feitelijk) transformaties van de verzamelde variabelen .

De verwerking omvat ook imputatiemethoden voor ontbrekende waarden. Dit beschrijft methoden voor het invoegen van de ontbrekende waarden met behulp van een te rechtvaardigen model. Hierbij is uiterste voorzichtigheid geboden, aangezien er inmiddels eigen onderzoek is op het gebied van imputatiemethoden.

Conventies en symbolen specificeren de resultaten van een zorgvuldige voorbereiding. De statistieken van de stad Bern werken volgens de volgende regels: [16]

symbool betekenis
- Streepje: er gebeurt niets (waarde exact nul).

Er wordt ook een streepje gezet als de conceptuele vereisten voor een invoer ontbreken, maar het teken kan worden vervangen door een nul in berekeningen.

0 0.0 Een maat kleiner dan de helft van de kleinste gebruikte eenheid.
() Lege haakjes: Er worden geen cijfers gegeven om redenen van gegevensbescherming.
... Afhankelijk van de context betekent drie punten: aantal niet bekend, niet relevant, om statistische redenen niet vermeld of niet van toepassing.
1 , 2 Een superscriptnummer geeft een voetnoot aan.
R Een superscript r geeft een waarde aan die is gecorrigeerd in vergelijking met de vorige ("herwerkt").
G Een superscript g wordt gebruikt voor geschatte datums.
/ Een schuine streep tussen twee jaar markeert de bijbehorende waarden als gemiddelde waarden.
- Een koppelteken tussen twee jaar geeft de bijbehorende waarden als som aan.
Σ Eventuele verschillen tussen de totale en toegevoegde individuele waarden of deelsommen zijn te wijten aan willekeurige afrondingsverschillen.

analyse

In de analysefase worden de methoden van verkennende, beschrijvende en inductieve statistiek toegepast op de gegevens (indicatoren, grafieken en tests). Door de gedeeltelijk automatisch verzamelde datavolumes en de steeds complexere evaluatieprocessen (zoals bootstrapping-processen ) is een analyse nauwelijks mogelijk zonder geschikte statistische software (zoals R).

interpretatie

Bij de interpretatie van de resultaten van de statistische analyse wordt uiteraard rekening gehouden met het betreffende vakgebied. Van groot en interdisciplinair belang is echter de omzetting van getallen in taal, de nauwkeurige taalkundige omzetting van de verkregen resultaten, de wetenschappelijke criteria. Zonder terug te verwijzen naar de hypothesen en vragen die in de loop van het wetenschappelijke kennisproces zijn opgeworpen, blijft de statistische analyse irrelevant. De meeste zwakke punten van een statistische analyse worden zichtbaar in de statistische evaluatie. Te vaak is er alleen de zuivere getalsweergave en wordt er te weinig aandacht besteed aan een duidelijke taalkundige borging van resultaten. Een overtuigende statistische evaluatie zal de verkregen resultaten verwerken in een vloeiende tekst, voorzien van de relevantie, de eerste stappen van de vraag naar de statistische methode, het hoogtepunt van een gestructureerde presentatie van de resultaten en, last but not least, de verwijzing naar de grotere wetenschappelijke context, ook in bewustzijn mogelijke zwaktes van de analyse. Alleen de referentie en kruisverwijzing naar andere wetenschappelijk verkregen en valide onderzoeksresultaten dragen dan bij aan een vooruitgang in kennis.

Informatie-inhoud en evaluatie

Statistieken vertegenwoordigen een weergave van de verzamelde gegevens. Afhankelijk van hoe de gegevens zijn verkregen, komt de inhoud van de informatie overeen met een bruikbaar resultaat. Als de echte en objectieve processen worden losgelaten, kunnen echter ook verkeerde conclusies worden getrokken uit statistieken. Hiermee kan worden bepaald hoe groot het aandeel tariefontduikers in de trein of het gemiddelde inkomen van de bevolking op een bepaalde locatie zou kunnen zijn. Er mogen echter geen correlaties worden gevormd uitsluitend uit statistisch gekoppelde gegevens.

Bij statistiek is het altijd van belang om de gehele data-inhoud te controleren op relevantie, op de relatie van de deelinformatie met elkaar en met de omgeving. Ook bij een juiste interpretatie van de data kan er onjuist bewijs worden gevonden als de ene of de andere relatie wordt weggelaten of in de verkeerde omgeving wordt geplaatst. Statistieken moeten daarom “ objectief ” (onafhankelijk van het standpunt van de statisticus), “ betrouwbaar ”, “ geldig ” (geldig over de context), “significant” (significant) en “ relevant ” (belangrijk) zijn.

Scholen en denkrichtingen

Leerboeken wekken soms de indruk dat er maar één, constant evoluerend statistisch model is. Er is weinig controverse in beschrijvende statistiek , maar in inductieve statistiek zijn er verschillende stromingen die een probleem op verschillende manieren analyseren, evalueren en numeriek berekenen. [17] Weinig bekende benaderingen zijn:

Inductieve statistiek wordt gedomineerd door:

De volgende tabel toont enkele verschillen tussen de soorten gevolgtrekkingen:

klassieke gevolgtrekking Bayesiaanse gevolgtrekking statistische beslissingstheorie
gebruikt gevolgtrekkingsconcept objectivist, cognitivist, frequentist subjectivistisch, cognitivistisch, niet-frequencyistisch subjectivist, decisionist, niet-frequencyist
Gebruikte informatie eerder: Prioriteitsinformatie → nu: voorbeeldgegevens → later: gevolgen van actie
alleen voorbeeldgegevens aanvullende prioriteitsinformatie extra gevolgen van actie
Informatieverwerking Bemonsterings- en waarschijnlijkheidsfuncties aanvullende prioriteitsverdelingen voor voorafgaande informatie en posterieure distributie met behulp van de formule van Bayes extra verliesfunctie voor de gevolgen van actie
Gebruikte methoden Punt- en intervalschatting en testprocedures op basis van de steekproefverdelingen Punt- en intervalschatting en testprocedures op basis van de posterieure verdelingen Oprichting van besluitvormingsfuncties
Methode beoordeling Onbekende parameter is vast en waarschijnlijkheidsverklaringen hebben alleen betrekking op de schatting . Onbekende parameter is stochastisch en heeft ook betrekking op waarschijnlijkheidsverklaringen .

gebruik maken van

Statistieken zijn oorspronkelijk ontwikkeld voor officiële statistieken en ook voor de analyse van kansspelen . In veel disciplines bestond behoefte aan 'objectieve' toetsing en besluitvorming van theorieën, waarvoor wiskunde en de regels van de statistiek geschikt zijn. De toepassing van statistische methoden in de specialistische wetenschappen heeft zijn eigen deelgebieden ontwikkeld.

  • Officiële statistieken zijn alle statistieken die zijn opgesteld door officiële instellingen, met name de statistische bureaus .
  • Met bedrijfsstatistieken wordt enerzijds de beschrijving en toetsing van interne processen met behulp van statistische methoden bedoeld en anderzijds externe statistieken voor een totaal van bedrijven.
  • Bevolkingsstatistieken zijn het aanleren van het systematisch vastleggen, presenteren en interpreteren van de demografische situatie en ontwikkeling met behulp van statistische methoden (zie ook demografie ).
  • Biostatistiek (ook: biometrie ) houdt zich bezig met vraagstukken die zich voordoen in medisch onderzoek en andere onderzoeksgebieden die te maken hebben met levende wezens.
  • Chemometrie (ook wel chemometrie) is de chemische subdiscipline die zich bezighoudt met het toepassen van wiskundige en statistische methoden om chemische processen en experimenten optimaal te plannen, ontwikkelen, selecteren of evalueren.
  • Datamining en machine learning zijn statistische en probabilistische modellen die patronen in de gegevens vastleggen door middel van rekenalgoritmen.
  • Demografie of bevolkingswetenschap is een wetenschappelijke discipline die zich statistisch bezighoudt met de ontwikkeling van populaties en hun structuren.
  • Epidemiologie is de wetenschappelijke discipline die zich bezighoudt met de oorzaken en gevolgen en de verspreiding van gezondheidsgerelateerde aandoeningen en gebeurtenissen in populaties.
  • Onderwijs gebruikt statistische technieken om grote studentenpopulaties te beschrijven en te begrijpen (bijv. PISA)
  • Financiële statistieken richten zich op drie onderwerpen: empirische analyses en modellering van financiële tijdreeksen, evenals op agenten gebaseerde modellering voor gesimuleerde en reële markten.
  • Geostatistiek verwijst naar bepaalde stochastische methoden voor het karakteriseren en schatten van ruimtelijk gecorreleerde georeferentiegegevens.
  • Gemeentelijke statistiek creëert kleinschalige primaire, secundaire en tertiaire statistieken voor statistische ruimtelijke referentie-eenheden [18] voor gemeentelijke planning en besluitvorming.
  • Econometrie is een tak van economie die economische theorie, wiskundige methoden en statistische gegevens samenbrengt om economisch theoretische modellen empirisch te controleren en economische verschijnselen kwantitatief te analyseren.
  • Operationeel onderzoek is een tak van toegepaste wiskunde die zich bezighoudt met de optimalisatie van bepaalde processen of procedures, waaronder statistische methoden.
  • Kwantitatieve taalkunde gebruikt statistische methoden om taalverwerving, taalverandering en het gebruik en de structuur van talen te onderzoeken.
  • Populatie-ecologie is een tak van ecologie die zich bezighoudt met de samenstelling, dynamiek en interactie van biologische populaties. Traditioneel wordt populatie-ecologie onderverdeeld in statistische populatiebeschrijving en populatiedynamiek. Een essentieel onderdeel hiervan is de interactie van populaties in de context van competitie en roofdier-prooirelaties.
  • Psychometrie is het gebied van de psychologie dat zich in het algemeen bezighoudt met de theorie en methode van psychologische meting. Het is een compilatie van (specifieke) wiskundige en statistische modellen en methoden. Deze zijn ontwikkeld om de in het kader van psychologisch onderzoek verkregen empirische gegevens samen te vatten en te beschrijven en daaruit conclusies te trekken. Bovenal dienen ze om psychologische modellen te creëren, zoals wiskundig-statistische, d.w.z. psychometrische modellen over verschillende cognitieve functionele gebieden, over persoonlijkheidsgebieden, die zijn afgeleid en geformaliseerd uit de overeenkomstige basistheorieën.
  • Six Sigma is een methode uit het kwaliteitsmanagement , met als kernelement het beschrijven, meten, analyseren, verbeteren en monitoren van bedrijfsprocessen met behulp van statistische middelen.
  • Sportstatistieken worden gebruikt om reeds behaalde sportprestaties te presenteren en worden gebruikt om deze prestaties te analyseren en voorspellingen te doen over toekomstige prestaties. Ze vormen de basis voor sportweddenschappen .
  • Statistische mechanica (ook: statistische thermodynamica) was oorspronkelijk een toepassingsgebied van de mechanica. De toestand van een fysiek systeem wordt niet langer gekenmerkt door het exacte temporele verloop van de positie en het momentum van de individuele deeltjes, maar door de waarschijnlijkheid om dergelijke microscopische toestanden te vinden en staat daarmee voor de (theoretische en experimentele) analyse van talrijke, fundamentele eigenschappen van systemen van vele deeltjes (Atomen, moleculen).
  • Statistische fysica houdt zich bezig met de beschrijving van natuurlijke fenomenen waarbij een groot aantal subsystemen (of deeltjes) betrokken zijn, maar alleen uitspraken over de totaliteit zijn van belang of fundamenteel alleen onvolledige informatie over het gedetailleerde gedrag van de subsystemen is beschikbaar. Het is een fysieke discipline waarvan de wiskundige basis bestaat uit stellingen van waarschijnlijkheidstheorie en asymptotische statistiek en een paar fysieke hypothesen.
  • Milieustatistieken houden zich bezig met het verzamelen van milieugegevens en de analyse van ecosystemen, hun druk en reacties, met behulp van statistische methoden.
  • Actuariële wetenschap is de wetenschap die wiskundige en statistische methoden toepast om risico's in het verzekerings- en banksysteem te meten.
  • Bedrijfsstatistieken is de studie van de systematische registratie, presentatie en interpretatie van economische feiten met behulp van statistische methoden.

opleiding

software

R is een open source statistische software

De ontwikkeling van computers sinds de tweede helft van de 20e eeuw heeft een grote invloed gehad op de statistiek. Vroege statistische modellen waren bijna altijd lineaire modellen . De toenemende rekencapaciteit en de ontwikkeling van geschikte numerieke algoritmen veroorzaakten een verhoogde interesse in niet-lineaire modellen, zoals kunstmatige neurale netwerken, en leidden tot de ontwikkeling van complexe statistische modellen, bijvoorbeeld gegeneraliseerde lineaire modellen of multilevel-modellen .

Door de individuele beschikbaarheid van statistische software kunt u ook zelf gegevens weergeven en een groot aantal berekeningen uitvoeren. Dit varieert van de berekening van locatieparameters (zoals gemiddelde waarden, mediaan, modus) en spreidingsmaten (zoals standaarddeviatie, variantie, bereik) tot complexe statistische modellen. Gegevens kunnen in de regel ook in een groot aantal diagrammen worden weergegeven, zoals boxplots en stambladdiagrammen. Visualisatieprogramma 's kunnen worden gebruikt voor gespecialiseerde afbeeldingen.

De toename van rekenkracht heeft ook geleid tot de toenemende populariteit van computerintensieve methoden op basis van resampling- technieken (permutatietests, bootstrapping-processen ). De toepassing van Bayesiaanse statistiek is ook mogelijk door het gebruik van Monte Carlo-simulaties , b.v. B. de Gibbs-sampling of het Metropolis-algoritme , is veel eenvoudiger en beter uitvoerbaar geworden.

Citaten

  • In 72% van alle gevallen dat mensen naar statistieken verwijzen, hebben ze ze nog maar net uitgevonden. zegt de fictieve detective Katrine Bratt tegen haar collega Harry Hole in de roman Koma uit 2013 van de Noorse schrijver Jo Nesbø .

Bedeutende Statistiker

Literatur

Portal: Statistik/Literatur – Übersicht zu Wikipedia-Inhalten zum Thema Statistik/Literatur

Weblinks

Commons : Statistics – Sammlung von Bildern, Videos und Audiodateien
Wiktionary: Statistik – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wikibooks: Einführung in Statistik – Lern- und Lehrmaterialien

Einzelnachweise

  1. a b Rinne, Horst.: Taschenbuch der Statistik . 4., vollständig überarb. und erw. Auflage. Deutsch, Frankfurt, M. 2008, ISBN 978-3-8171-1827-4 , S.   1 .
  2. Lincoln E. Moses: Think and Explain with statistics . Addison-Wesley, 1986, ISBN 978-0-201-15619-5 , S.   1–3 .
  3. David Moore: Statistics for the Twenty-First Century . The Mathematical Association of America, Washington, DC 1992, Teaching Statistics as a Respectable Subject, S.   14–25 .
  4. William Lee Hays: Statistics for the social sciences . Holt, Rinehart and Winston, 1973, ISBN 978-0-03-077945-9 , S.   xii .
  5. Wolfgang Polasek: Explorative Daten-Analyse . Einführung in die deskriptive Statistik. 2. Auflage. Springer, Berlin 1994, ISBN 978-3-540-58394-3 .
  6. Ian Shaw: The Oxford History of Ancient Egypt . Oxford University Press, 2004, ISBN 978-0-19-280458-7 , S.   4–5 .
  7. Statistisches Bundesamt Wiesbaden (Hrsg.): Bevölkerung und Wirtschaft 1872–1972 . W. Kohlhammer Stuttgart/Mainz, 1972, S.   15–16 .
  8. Jürgen Osterhammel: Die Verwandlung der Welt. Eine Geschichte des 19. Jahrhunderts. CH Beck. 2 Aufl. der Sonderausgabe 2016, ISBN 978-3-406-61481-1 , S. 59.
  9. Sansovino, F. (1578), Del governo et amministratione di diversi regni et repvbliche, cosi antiche come moderne , Per ordine di Iacomo Sansouino, Venetia ( Open Library ).
  10. Botero, G. (1589), Della ragion di Stato libri dieci , Appresso i Gioliti, Venetia ( Open Library ).
  11. Jürgen Osterhammel: Die Verwandlung der Welt. Eine Geschichte des 19. Jahrhunderts. CH Beck. 2 Aufl. der Sonderausgabe 2016, ISBN 978-3-406-61481-1 , S. 60.
  12. Peter Koch: Beiträge zur Geschichte des deutschen Versicherungswesens, Teil 2 . Verlag Versicherungswirtschaft, 2005, S.   28 .
  13. Graunt, J. (1665) Natural and Political Observations mentioned in a following Index, and made upon the Bills of Mortality , 1665 ( Digitalisat ).
  14. JE Wappäus (1861), Allgemeine Bevölkerungsstatistik (Zweither Theil) Verlag der JC Hinrichs'schen Buchhandlung, Leipzig, S. 411ff.
  15. Statistisches Raumbezugssystem .
  16. Statistisches Jahrbuch der Stadt Bern, Berichtsjahr 2016.
  17. H. Rinne: Taschenbuch der Statistik. (2. Auflage), Harri Deutsch Verlag, Frankfurt am Main 1997, S. 471 ff.
  18. Kommunales Raumbezugssystem: http://www.staedtestatistik.de/agk.html