Den 8 augusti släppte Amazon Web Services AWS Lake Formation, en datasjötjänst. Många kunder använde redan Amazon S3 (Simple Storage Services) för sin datasjö, så Lake Formation kan bäst ses som en uppsättning verktyg för att göra en Amazon-datasjö billigare och mer användarvänlig.
Den 8 augusti släppte Amazon Web Services AWS Lake Formation, en datasjötjänst. Många kunder använde redan Amazon S3 (Simple Storage Services) för sin datasjö, så Lake Formation kan bäst ses som en uppsättning verktyg för att göra en Amazon-datasjö billigare och mer användarvänlig.
Amazon listar fem nyckelverktyg som Amazon Web Services Lake Formation tillhandahåller: källsökrobotar, ETL och dataförberedelser, datakatalog, säkerhetsinställningar och åtkomstkontroll. Alla dessa verktyg hanteras via en central Lake Formation Console. Andra AWS-tjänster som Athena, Redshift och EMR kommer fortfarande att kunna komma åt data när de har flyttats över.
AWS Lake Formation-källsökrobotar syftar till att minska de omkostnader som är inblandade i att bara hämta data var de än befinner sig i din datasjö. Kunder med befintliga S3-instanser behöver bara peka Lake Formation på de instanser de vill dra in. Processen är något mer involverad för nya kunder eller de som vill lägga till nya datakällor. AWS Lake Formation kan dra in hela databaser eller göra inkrementella uppdateringar baserat på användardefinierade tabeller och nycklar.
AWS Lake Formation använder AWS-lim för att tillhandahålla tjänster för extraktion, transformation, laddning (ETL) och dataförberedelse. Lake Formation tillhandahåller också en inbyggd maskininlärningstjänst för att deduplicera data när den tas in. Detta bör hjälpa till att hålla storleken på datasjön, och därmed kostnaderna, nere.
Ett av de tuffaste hindren för datasjöar är att hålla reda på vad som finns i sjön. AWS Lake Formation tillhandahåller en datakatalog som beskriver de olika datamängder som är tillgängliga tillsammans med vilka grupper av användare som har tillgång till var och en. Detta bör göra processen att hitta relevanta datamängder mer användarvänlig.
De två sista inbyggda verktygen är egentligen en uppsättning verktyg för att tillhandahålla säkerhet och åtkomstkontroll. Verktygsuppsättningen inkluderar tjänster som AWS Identity, Access Management och AWS Key Management Service. AWS Lake Formation tillåter kunder att ställa in datasjöövergripande policyer via den centrala konsolen. Om mer detaljerad kontroll behövs, stöder den även säkerhetsinställningar per datamängd.
Tillgänglighet
Omedelbar
Anmäl dig till StorageReviews nyhetsbrev