Casa Impresa Google rilascia Cloud Dataproc in versione beta

Google rilascia Cloud Dataproc in versione beta

by Adam Armstrong

Google ha annunciato un'altra nuova tecnologia cloud all'interno della sua linea Cloud Platform, Google Cloud Dataproc. Questa nuova tecnologia cloud ha lo scopo di rendere Hadoop e Spark più facili da implementare e gestire all'interno di Google Cloud Platform. Proprio come il recente annuncio di Dell e Cloudera, questa tecnologia consente l'utilizzo di Hadoop senza gli elevati costi di formazione coinvolti.


Google ha annunciato un'altra nuova tecnologia cloud all'interno della sua linea Cloud Platform, Google Cloud Dataproc. Questa nuova tecnologia cloud ha lo scopo di rendere Hadoop e Spark più facili da implementare e gestire all'interno di Google Cloud Platform. Proprio come il recente annuncio di Dell e Cloudera, questa tecnologia consente l'utilizzo di Hadoop senza gli elevati costi di formazione coinvolti.

Poiché i set di dati continuano a crescere in dimensioni e complessità, saranno necessari strumenti più potenti per analizzare questi set di dati. Sebbene gli strumenti esistano, spesso aggiungono un ulteriore livello di complessità e può essere costoso formare gli amministratori sulle nuove tecnologie o coinvolgere consulenti. Google sta introducendo Dataproc, un servizio automatico e gestito per Hadoop e Spark. Con Dataproc gli utenti possono trarre vantaggio dagli strumenti dati open source per l'elaborazione batch, l'esecuzione di query, lo streaming e l'apprendimento automatico utilizzando al tempo stesso l'automazione per creare e gestire rapidamente i cluster. Dataproc consente inoltre di disattivare i cluster quando non vengono utilizzati, contribuendo a risparmiare sui costi poiché la fatturazione avviene minuto per minuto.

I vantaggi includono:

  • Cloud Dataproc ha un prezzo di solo 1 centesimo per CPU virtuale all'ora nel cluster di un cliente, oltre alle altre risorse Cloud Platform utilizzate. I cluster Cloud Dataproc possono includere istanze prerilasciabili che hanno prezzi di elaborazione inferiori, riducendo ulteriormente i costi. Invece di arrotondare l'utilizzo all'ora più vicina, Cloud Dataproc addebita ai clienti solo l'utilizzo con fatturazione minuto per minuto e un periodo di fatturazione minimo di dieci minuti.
  • Senza utilizzare Dataproc, possono essere necessari dai 5 ai 30 minuti per creare cluster Spark e Hadoop in locale o tramite provider IaaS. In confronto, i cluster Cloud Dataproc sono rapidi da avviare, ridimensionare e arrestare e ciascuna di queste operazioni richiede in media 90 secondi o meno. Ciò significa che gli utenti possono dedicare meno tempo all'attesa dei cluster e più tempo a lavorare con i propri dati.
  • Cloud Dataproc ha un'integrazione integrata con altri servizi Google Cloud Platform, come BigQuery, Archiviazione nel cloud, Big Table sul cloud, Cloud Logging e Cloud Monitoring, in modo che i clienti abbiano più di un semplice cluster Spark o Hadoop: hanno una piattaforma dati completa. Ad esempio, possono utilizzare Cloud Dataproc per ETL terabyte di dati di log non elaborati direttamente in BigQuery per il reporting aziendale.
  • I clienti possono interagire facilmente con cluster e processi Spark o Hadoop tramite Google Developers Console, Google Cloud SDK o l'API REST Cloud Dataproc. Una volta terminato l'utilizzo di un cluster, possono semplicemente disattivarlo in modo da non sprecare denaro con un cluster inattivo. Non devi preoccuparti di perdere dati, perché Cloud Dataproc è integrato con Cloud Storage, BigQuery e Cloud Bigtable.
  • Non è necessario apprendere nuovi strumenti o API per utilizzare Cloud Dataproc, semplificando lo spostamento dei progetti esistenti in Cloud Dataproc senza riqualificazione. Spark, Hadoop, Pig e Hive vengono aggiornati frequentemente, così gli utenti possono essere produttivi più velocemente.

Disponibilità e prezzi

Google Cloud Dataproc è ora disponibile come servizio beta a partire da $ 0.01 per CPU virtuale.

Google Cloud Dataproc

Discuti questa storia

Iscriviti alla newsletter di StorageReview