10 Fenomenala resurser för öppna data

10 Fenomenala resurser för öppna data - dummies

Öppna data är en del av en större trend mot en mindre restriktiv och mer öppen förståelse av idén om immateriella rättigheter, en trend som har vunnit enorm popularitet under det senaste decenniet. Öppna data är data som har gjorts offentligt tillgängliga och får användas, återanvändas, byggas på och delas med andra. Öppna data ingår i den öppna rörelsen.

Utöver öppen data innehåller denna lämpliga namngivna öppen rörelse också öppen källkod, öppen hårdvara, kreativt arbete med öppen innehåll, öppen åtkomst till vetenskapliga tidskrifter och öppen vetenskap - alla engagerade i den uppfattningen att innehåll (inklusive rådata från experiment) ska delas fritt.

Kännetecknet för öppna licenser är att de har copyleft istället för upphovsrätt. Med copyleft, är den enda begränsningen att arbetskällan måste identifieras, ibland med det tillvägagångssätt som derivat fungerar kan inte upphovsrättsskyddat med en mer restriktiv licens än originalet. Om det andra villkoret gäller, blir det svårt att kommersialisera själva arbetet, även om det ofta finns många andra indirekta, kreativa sätt att kommersialisera.

Var medveten om att ibland arbete som är märkt som öppet kanske inte passar den accepterade definitionen. Du är ansvarig för att kontrollera licensrättigheterna och begränsningarna för den öppna data du använder.

Folk förvirrar ofta öppna licenser med Creative Commons-licenser. Creative Commons är en ideell organisation som syftar till att uppmuntra och sprida kreativa verk genom att erbjuda en rättslig ram genom vilken användningsbehörigheter kan beviljas och erhållas så att delande parter är säkra på juridiska risker när de bygger på och använda arbete och kunskap som har delats öppet. Vissa Creative Commons licenser är öppna, och vissa förbjuder uttryckligen avledda verk och / eller kommersialisering.

Som en del av de senaste öppna regeringens initiativen började regeringarna runt om i världen släppa öppna regeringsdata. Regeringarna tillhandahåller generellt dessa uppgifter så att de kan användas av volontäranalytiker och civila hackare - programmerare som arbetar tillsammans för att bygga open source-lösningar som använder öppna data för att lösa sociala problem - i ett försök att gynna samhället på stor. Under 2013 tecknade G8-länderna (Frankrike, Förenta staterna, Förenade kungariket, Ryssland, Tyskland, Japan, Italien och Kanada) ett charter som förbinder sig att öppna data, prioritera områdena nationell statistik, valresultat, statsbudgetar, och nationella kartor.

Den öppna regeringsrörelsen främjar öppenhet och ansvarighet hos myndigheterna, främjar välinformerade väljare och uppmuntrar till offentligt engagemang. För att uttrycka det i databehandlingstillstånd underlättar öppen regering ett läs / skrivförhållande mellan en regering och dess medborgare.

Gräva igenom data. gov

Data. gov-programmet startades av Obama-administrationen för att ge öppen tillgång till icke-klassificerade USA-regeringsdata. Data. Gov data produceras av alla avdelningar i verkställande avdelningen - Vita huset och alla kabinettavdelningar - samt dataset från andra nivåer av regeringen. I mitten av 2014 kunde du söka efter över 100 000 dataset genom att använda Data. gov-sökning. Webbplatsen är en oöverträffad resurs om du letar efter data från USA: s regeringar om följande indikatorer:

 • Ekonomisk
 • Miljö
 • STEM-industrin
 • Livskvalitet
 • Legal

Check Out Kanada Open Data

Om du tittar på webbplatsen för Kanada Open Data, är landets starka engagemang för data överväldigande uppenbart. På Canada Open Data-webbplatsen hittar du över 200 000 dataset. Bland de 25 mest populära erbjudanden på Canada Open Data-webbplatsen finns dataset som täcker följande indikatorer:

 • Miljö
 • Medborgarskap
 • Livskvalitet

Dykning i data. LEDARE Storbritannien

Förenade kungariket började med en sen start i den öppna regeringsrörelsen. Data. LEDARE Storbritannien startades 2010, och i mitten av 2014 var endast cirka 20 000 dataset ännu tillgängliga. Gilla Data. gov, data. LEDARE Storbritannien drivs också av CKAN-datakatalogen.

Även om data. LEDARE Storbritannien spelar fortfarande upp och har en imponerande samling av Ordnance Survey-kartor som är tillräckligt gamla - 50 år eller mer - för att inte vara upphovsrättsligt skyddade. Om du letar efter världsberömda, gratis att använda kartor, data. LEDARE Storbritannien är en otrolig plats för dig att utforska. Utöver sin stellar kartläggning kartor, data. LEDARE Storbritannien är en användbar källa för data om följande indikatorer:

 • Miljö (999)> Offentliga utgifter
 • Samhälle
 • Hälsa
 • Utbildning
 • Näringsliv och ekonomisk
 • Checkar ut amerikanska folkräkningsuppgifterna

USA: s folkräkning hålls vart tionde år, och sedan 2010 har uppgifterna gjorts fritt tillgängliga. Statistiken är tillgänglig nere till folkräkningsblocket - som i genomsnitt beräknas med 30 personer. Demografiska data som tillhandahålls av US Census Bureau kan vara till stor hjälp om du gör marknadsföring eller reklamforskning och behöver rikta din publik enligt följande klassificeringar:

Ålder

 • Genomsnittlig årlig inkomst
 • Hushållens storlek < Kön eller ras
 • Utbildningsnivå
 • Att veta NASA Data
 • Sedan starten 1958 har NASA publicerat alla sina icke-klassificerade projektdata. Det har varit i open-data-spelet så länge att NASA har massor av data! NASA dataset har växit ännu snabbare med de senaste förbättringarna inom satellit- och kommunikationsteknik. Faktum är att NASA nu genererar 4 terabyte nya jordvetenskapliga data per dag - det motsvarar över en miljon MP3-filer.Många av NASAs projekt har samlat data i petabyte-sortimentet.

NASAs öppna dataportal heter data. Denna portal är en källa till alla slags underbara data, inklusive data om

Astronomi och rymd (naturligtvis!)

Klimat

 • Biovetenskap
 • Geologi
 • Teknik
 • Wrangling World Bank Data
 • Världsbanken är ett internationellt finansiellt institut som drivs av FN. Det ger lån till utvecklingsländer att betala för kapitalinvesteringar som leder (en förhoppning) till fattigdomsminskning och lite överskott, så att mottagarländerna kan återbetala lånemängderna över tiden. Eftersom Världsbankens tjänstemän måste fatta välinformerade beslut om vilka länder som är mer benägna att betala tillbaka sina lån, har de samlat en enorm mängd data om medlemslanden. De har gjort uppgifterna tillgängliga för allmänheten på sidan Världsbankens öppna data.

Om du letar efter data för att bekräfta ditt argument i en verkligt intressant data-journalistik som stöds av global statistik, bör Världsbanken vara din go-to-källa. Oavsett omfattningen av ditt projekt, om du behöver data om vad som händer i utvecklingsländer, är Världsbanken platsen att gå. Du kan använda webbplatsen för att ladda ner hela dataset eller helt enkelt se datavisualiseringarna online. Du kan också använda Världsbankens Open Data API för att få tillgång till det du behöver.

Världsbankens Open Data levererar data om följande indikatorer (och många, många fler):

Jordbruk och landsbygdsutveckling

Ekonomi och tillväxt

 • Miljö
 • Vetenskap och teknik
 • Finansiell sektor < Fattigdomsinkomst
 • Världsbankens data inkluderar även
 • mikrodata
 • - provundersökningar av hushåll och företag i utvecklingsländer. Du kan använda mikrodata för att utforska variationer i dina dataset.

Lär känna Knoema Data Knoema (uttalad "no-mah") är den största förvaret av offentliga data på webben. Knoema-plattformen innehåller en staggerande 500+ databaser, förutom dess 150 miljoner tidsserier

- 150 miljoner samlingar av data om attributvärden över tiden, med andra ord. Knoema inkluderar, men är inte begränsat till, alla dessa datakällor:

Regeringsdata från industriländer Nationella offentliga data från utvecklingsländer Förenta nationerna data

 • Internationella organisationsdata
 • Företagsdata från globala företag
 • Knoema är en enastående resurs om du letar efter internationell data om jordbruk, brottsstatistik, demografi, ekonomi, utbildning, energi, miljö, livsmedelssäkerhet, utrikeshandel, hälsa, markanvändning, forskning och utveckling, telekommunikation, turism, transport eller vatten.
 • Förutom att vara en otrolig datakälla är Knoema en mångfacetterad tasking-plattform. Du kan använda Knoema-plattformen för att skapa instrumentpaneler som automatiskt spårar alla dina favoritdataset. Du kan använda plattformens datavisningsverktyg för att snabbt och enkelt se dina data i ett tabellformat eller kartformat.Du kan använda Knoema Data Atlas för att borra ner bland kategorier och / eller geografiska regioner och snabbt komma åt de specifika dataset du behöver. Som enskild person kan du ladda upp dina egna data och använda Knoema som en gratis webbhotell. Utöver allt detta erbjuder Knoema även Knoema Market - en plats där du kan gå för att få betalt bara för att vara en del av datastyrda projekt.
 • Även om mycket av Knoemas data är ganska generellt, kan du fortfarande hitta några överraskande specifika data också. Om du har svårt att hitta data på ett visst ämne kan du få lycka till att hitta den på Knoema-plattformen. Figuren illustrerar hur specifika Knoema data kan vara.

Indexet för insektsregister i Knoemas sökning.

Köpa med Quandl Data

Quandl är en Toronto-baserad webbplats som syftar till att vara en sökmotor för numeriska data. Till skillnad från de flesta sökmotorer genereras emellertid inte databasen automatiskt av spindlar som kryper på webben. Snarare fokuserar den på länkade data som uppdateras via

crowdsourcing

- med andra ord manuellt uppdaterad via mänskliga kuratorer.

Eftersom de flesta ekonomiska uppgifterna är numeriska, är Quandl ett utmärkt verktyg för att hålla sig uppdaterad om den senaste affärsinformatiken. Som du kan se ger en sökning på Apple över 4 700 data från 11 olika källor med tidsserier på dagliga, veckovisa, månadsvisa, kvartalsvisa eller årliga nivåer. Många av dessa resultat är relaterade till FN: s jordbruksdata. Om du letar efter data på Apple-datorer kan du begränsa omfattningen av din sökning genom att ersätta sökordet

Apple med företagets lagerförkortning, AAPL . Indexet för Apple-poster i Quandl-sökning. Quandl-databasen innehåller länkar till över 10 miljoner dataset (även om det använder en generös metrik för att förklara vad som skiljer en dataset från en annan). Quandl länkar till 2. 1 miljon FN-dataset och många andra källor, inklusive dataset i Open Financial Data Project, centralbanker, fastighetsorganisationer och välkända tanktankar. Exploring Exversion Data

Modellerad efter GitHub - den molnhärdda plattformen över vilken programmerare kan gemensamt dela och granska kod - Exversion syftar till att ge samma samarbetsfunktionalitet kring data som GitHub tillhandahåller runt kod. Exversion-plattformen erbjuder versionskontrollfunktionalitet och värdtjänster som du kan ladda upp och dela med dig av. För att illustrera hur Exversion fungerar kan du föreställa dig en plattform som gör att du kan först

gaffel

(eller kopiera) en dataset och sedan göra de ändringar du vill ha. Exversion skulle vara där för att hålla reda på vad som har förändrats från den ursprungliga uppsättningen och varje förändring som du gör till den. Exversion tillåter också användare att betygsätta, granska och kommentera dataset.

Dataset som finns på Exversion-plattformen tillhandahålls antingen av en användare eller skapas av en spindel som krypterar och indexerar öppna data för att göra det sökbart från ett enda programmeringsgränssnitt (API).Liksom GitHub, med ett gratis användarkonto, är alla uppgifter du laddar upp till Exversion offentliga. Om du är villig att betala för ett konto kan du skapa egna, privata datalager. Med det betalda kontot får du också möjlighet att dela dina data med utvalda användare för samarbetsprojekt. Mapping OpenStreetMap Spatial Data OpenStreetMap (OSM) är ett öppet alternativ för kommersiell kartläggning som Google Maps och ESRI ArcGIS Online. I OSM skapar, laddar eller digitaliserar geografiska data i centralförvaret.

OSM-plattformen är ganska robust. Regeringar och privata företag har börjat bidra till och dra från de gemensamma dataseterna. Även företag som är lika stora som Apple är beroende av OSM-data. OSM har nu över 1 miljon registrerade användare. För att illustrera hur en person kan skapa data i OSM kan du föreställa dig att någon kopplar GPS-systemen på sin mobiltelefon till OSM-applikationen. På grund av detta tillstånd kan OSM automatiskt spåra vägarna när personen reser. Senare kan den här personen (eller en annan OSM-användare) gå in i OSM-plattformen för att verifiera och märka resorna.

Data i OSM lagras inte som kartor, men som geometriska och textrepresentationer - punkter, linjer, polygoner och kartannoteringar - så kan alla OSM-data snabbt hämtas från webbplatsen och enkelt monteras i en kartografisk representation via en stationär applikation.