10 Hadoop Resurser värda en bokmärke

10 Hadoop Resurser värda en bokmärke - dummies

Följande är tio fantastiska Hadoop-resurser som är värdiga att skapa ett bokmärke i din webbläsare. Dessa resurser hjälper dig att skapa en livslångt lärande plan för Hadoop.

Central nervsystemet: Apache. org

Apache Software Foundation (ASF) är det centrala samhället för program med öppen källkod. Inte bara ett projekt kan vara ett Apache-projekt - många konsensusstyrda processer konverterar en mjukvara från sin ursprungliga design och beta-kod (dess status inkubator ) till fullfjädrad, allmänt tillgänglig programvara.

ASF är inte bara där projekt som Hadoop hanteras - det är där de "bor och andas. "Idag finns hundratals Apache-projekt. Med det här inlägget bör du bokmärke Apache Hadoop-sidan som en av dina grundvalskurser. Den här webbplatsen är viktig eftersom du kan komma åt källkoden där.

Tweet detta

Twitter är inte platsen att lära Hadoop i sig - du kan trots allt inte enkelt behärska MapReduce-programmeringen i lektioner som sträcker sig över 140 tecken. Det är så som möjligt, en hel del stora datavuruer är på Twitter, och de uttrycker åsikter och pekar på resurser som kan göra dig till en smartare Hadoop-användare.

Ett antal toppinflytande listor i Twitter-landskapshöljet Hadoop och stora data, och det är det bästa sättet att hitta dessa Hadoop-personligheter och lägga till dem i dina Twitter-listor.

Hortonworks University

Hortonworks University ger Hadoop utbildning och certifieringar. Webbplatsen erbjuder Hadoop-kurser byggda för antingen administratör eller utvecklare med möjlighet till ett strikt certifieringsprogram. Hortonworks sysselsätter några av de djupaste och mest noterade Hadoopexperterna i världen, så du är säker på kvalitetskompetens bakom kursmaterialet.

Cloudera University

Cloudera University är likadant i sin affärsmodell och stadga till Hortonworks University, vilket ger ett antal inlärningsmöjligheter som kör spalten från traditionell text till video. Cloudera är en framträdande fixtur i Hadoop-världen. (Doug Cutting, Hadops "fader" är dess huvudarkitekt.) Webbplatsen erbjuder en omfattande uppsättning kurser och mer, som bygger på Cloudera Distribution för Hadoop (CDH).

BigDataUniversity. com

BigDataUniversity. com (ärendet spelar ingen roll när du anger webbadressen i din webbläsare) är en fantastisk resurs för att lära dig om - du gissade det - stora data. Naturligtvis är stora data inte bara Hadoop, så du hittar mer än Hadoop-resurser på den här webbplatsen.Detta universitet har över 100 000 studenter inskrivna och lär sig om Hadoop och stora data varje dag.

Planet Big Data Blog Aggregator

Det är fantastiskt när namnet på en webbplats säger dig exakt vad det gör - som planet Big Data Blog Aggregator: Det är en aggregator av bloggar om stora data, Hadoop och andra relaterade ämnen på planet (ja, på planeten jorden ändå).

Både stora namn och inga namn visas på webbplatsen, men det är till hjälp: Trots att det utan tvekan är ett engagemang för Hadoop av Cloudera, Hortonworks, IBM och andra, är det ofta uppfriskande och värdefullt att få exponering för tankar och åsikter gräsrötter, icke-anslutna utövare av samhällen som inte är knutna till en specifik leverantör i din färdplan.

Quoras Apache Hadoop forum

Quora Apache Hadoop forum är hörnstenen för alla som vill veta mer om Hadoop, eller om stora data i allmänhet, för den delen.

Som i alla forum är det många olika frågor och svar du kan hitta på denna sida, men alla leder dig till det du letar efter: kunskap. Webbplatsen har länkar till Hadoop och till dess enskilda komponenter - till exempel har det särskilda forum för MapReduce, HDFS, Pig, HBase och mer.

Sidan har också associerat Hadoop forum; Cloudera och Hortonworks har till exempel specifika diskussionsgrupper för deras distributioner - ett testament till hur populärt detta forum är.

IBM Big Data Hub

IBM Big Data Hub är ett utmärkt ställe att lära om Hadoop och dess ekosystem. Trots att det ägs och drivs av IBM, är innehållets innehåll inte alltid kopplat till IBM-produkter.

IBM Big Data Hub ger alla besökare tillräckligt med kunskaper för att släcka någons törst efter stora data. Du hittar alla slags bloggar, videoklipp, analytikerartiklar, användarfall, infographics, presentationer och mer. Det är verkligen en skattkista av stora datafiler.

Konferenser som inte får missa

Det finns många Hadoop-konferenser, och ännu fler stora datakonferenser - Hadoop-toppmötet och Strata Hadoop World som de klocktvätta konferenser som inte får missa. Typiskt sponsrar en distributionsleverantör dessa konferenser. Till exempel Yahoo! och Hortonworks sponsrar Hadoop-toppmötet, och Cloudera är medsponsor för Strata Hadoop World.

Både Strata Hadoop World och Hadoop Summit är de samlingsplatserna för de ljusaste Hadoop-sinnena i branschen; Dessa konferenser lockar ett brett spektrum av Hadoop-intresserade proffs, inklusive beslutsfattare, arkitekter, utvecklare, analytiker och mer.

Google-dokumenten som startade allt

Vad som nu är känt som Hadoop har sin genesis i ett antal papper skrivna av Google-anställda som fokuserade på problemet med att indexera webben.

Medan Apache Nutch-projektet (en öppen källteknik för krypning på webben) gjorde sitt fokus på att skala utåt för att indexera högre volymer av webbdata, publicerade Google ett papper, "The Google File System" (oktober 2003) , vilket starkt påverkat Doug Cutting och hans Nutch grundare, Mike Cafarella.Kort därefter släppte Google sitt papper "MapReduce: Förenklad dataprocessering på stora kluster" (december 2004).

Sammanfattningsvis togs begreppet distribuerat filsystem och en storskalig parallellbehandlingsram av Cutting and Cafarella för att utveckla Apache Hadoop. Naturligtvis har Cutting kommersialiserat detta arbete vid Yahoo! , och resten, som de säger, är historia.