Cloud AWS
Cloud AWS
Richiedi la prova gratuita

Amazon Redshift è una soluzione di data warehousing agile, completamente gestita e scalabile a livello di petabyte in grado analizzare i dati in modo semplice e conveniente senza rivoluzionare gli strumenti di business intelligence già in uso. Puoi iniziare con una soluzione di base a un costo di 0,25 USD all'ora, senza impegni né pagamenti anticipati, per poi ricalibrare la capacità fino a petabyte a una tariffa pari a 1.000 USD per terabyte all'anno, meno di un decimo dei costi delle soluzioni tradizionali. Spesso i nostri clienti ottengono una compressione tre volte superiore, che riduce le loro spese di 333 USD all'anno per ogni terabyte di dati non compressi.

Prestazioni rapide e costanti

Rapido

Amazon Redshift offre elevate prestazioni in elaborazione di query perché le carica in modo parallelo su più nodi e sfrutta una tecnologia di storage basata su colonne che migliora l'efficienza in I/O. La velocità di carico dei dati può essere ridimensionata in modo lineare a seconda delle dimensioni del cluster, sfruttando l'integrazione con Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis o qualsiasi host compatibile con SSH.

Scalabilità elevata

Costi ridotti

I prezzi sono calcolati solo in base all'uso effettivo. Puoi avere un numero illimitato di utenti che eseguono analisi sui dati per 1.000 USD per terabyte all'anno, che corrisponde a circa un decimo del costo delle soluzioni di data warehousing tradizionali.

Flessibilità

Semplicità

Amazon Redshift consente di automatizzare con la massima semplicità le attività di amministrazione più comuni per gestire, monitorare e ridimensionare il data warehouse. Il cliente è così sollevato da una serie di attività lunghe e complesse e può concentrarsi sulle informazioni e sul business.

Programmazione basata sugli eventi

Elasticità

Il cluster può essere ridimensionato con la massima semplicità in base alle esigenze; sono sufficienti pochi clic sulla console o una chiamata API.

 

Controllo granulare degli accessi

Sicurezza

Le funzioni di protezione sono già integrate. È possibile crittografare sia i dati su disco sia quelli in transito tramite i protocolli AES-256 e SSL con accelerazione hardware, isolare i cluster utilizzando Amazon VPC, oppure gestire le proprie chiavi utilizzando AWS Key Management Service (KMS)Hardware Security Module (HSM, moduli di protezione hardware).

Servizio completamente gestito

Compatibilità

Amazon Redshift supporta SQL standard e fornisce driver JDBC e ODBC personalizzati da scaricare dalla console, consentendo l'utilizzo dei client SQL più utilizzati. È anche possibile impiegare driver PostgreSQL JDBC e ODBC standard.

Ottimizzazione per data warehouse

Le elevate prestazioni in elaborazione di query sono garantite da una serie di importanti innovazioni, che si applicano a dataset di qualsiasi ordine di grandezza, dalle centinaia di gigabyte ai petabyte. Per ridurre la quantità di I/O necessari per elaborare le query, Amazon Redshift impiega storage basato su colonne, compressione dei dati e mappature di zona. Inoltre l'architettura MPP (Massively Parallel Processing, elaborazione parallela di massa) del suo data warehouse consente di caricare in parallelo e distribuire le operazioni SQL, in modo da sfruttare al massimo tutte le risorse disponibili. L'hardware utilizzato è stato progettato per fornire prestazioni di alto livello in elaborazione dei dati: si serve di storage locali per massimizzare il throughput tra CPU e unità e di reti mesh a 10 Gigabit Ethernet per massimizzare il throughput tra nodi.

 

Capacità di più petabyte

Sono sufficienti pochi clic nella console o una semplice chiamata API per modificare il numero o il tipo di nodi nel data warehouse e gestire fino a diversi petabyte di dati compressi degli utenti. Con i nodi Dense Storage (DS) si creano data warehouse di grandi dimensioni composti di dischi rigidi (HDD) a prezzi molto competitivi. Con i nodi Dense Compute (DC) si creano data warehouse ad alte prestazioni composti di dischi allo stato solido (SSD), CPU performanti ed elevate quantità di RAM. Durante la ricalibrazione delle risorse, Amazon Redshift consente di proseguire l'interrogazione del data warehouse in sola lettura finché non viene completato il provisioning del nuovo cluster.

Nessun investimento anticipato

I prezzi sono calcolati in base alle risorse effettive di cui è stato effettuato il provisioning. È possibile scegliere tra un modello di pagamento on demand, senza pagamenti anticipati né impegni di lungo termine, e istanze riservate che consentono tariffe molto più contenute. La tariffa on demand parte da 0,25 USD all'ora per un nodo DC1.Large da 160 GB, oppure da 0,85 USD all'ora per un nodo DS2.XLarge da 2 TB. Con le istanze riservate e un pagamento anticipato parziale, il prezzo effettivo può scendere a 0,10 USD all'ora per un nodo DC1.Large (5.500 USD per TB all'anno) oppure 0,228 USD all'ora per un nodo DS2.XLarge (999 USD per TB all'anno). Per ulteriori informazioni, ti invitiamo a consultare la pagina dei prezzi di Amazon Redshift.

Tolleranza ai guasti

Amazon Redshift dispone di numerose funzionalità che rafforzano l'affidabilità del cluster del data warehouse. Tutti i dati scritti su un nodo nel cluster vengono automaticamente replicati su altri nodi all'interno dello stesso cluster; al contempo, viene eseguito un backup continuo di tutti i dati su Amazon S3. Amazon Redshift monitora inoltre senza soluzione di continuità l'integrità del cluster, replicando una seconda volta i dati provenienti da unità con errori e procedendo, quando necessario, alla sostituzione dei nodi.

Backup automatici

Amazon Redshift esegue il backup automatico e continuo dei nuovi dati in Amazon S3. Gli snapshot vengono conservati per un periodo personalizzabile compreso tra 1 e 35 giorni. È anche possibile acquisire snapshot manualmente in qualsiasi momento; in questo caso vengono conservati finché non vengono eliminati dall'utente. Amazon Redshift è anche in grado di replicare gli snapshot in modo asincrono su Amazon S3 in una regione differente, a scopo di disaster recovery. Una volta eliminato un cluster, gli snapshot di sistema vengono rimossi, mentre gli snapshot acquisiti dall'utente sono disponibili finché non vengono rimossi manualmente.

Ripristino rapido

È possibile utilizzare snapshot di sistema o creati manualmente per ripristinare un cluster mediante la Console di gestione AWS oppure le API di Amazon Redshift. Il cluster è disponibile non appena viene completato il ripristino dei metadati del sistema ed è possibile avviare query mentre ancora viene eseguito lo spool dei dati in background.

Crittografia

Configurando alcune semplici impostazioni, Amazon Redshift può applicare il protocollo SSL per proteggere i dati in transito e il protocollo di crittografia AES a 256 bit per i dati su disco. Se si sceglie di abilitare la crittografia dei dati su disco, tutti i dati scritti sulle unità saranno crittografati, inclusi i backup. Per impostazione predefinita, la gestione delle chiavi è prerogativa di Amazon Redshift, ma puoi decidere di gestire di persona le chiavi utilizzando HSM (moduli di protezione hardware), AWS CloudHSM o AWS Key Management Service.

Isolamento di rete

Amazon Redshift consente di configurare le regole del firewall in modo da controllare gli accessi al cluster del data warehouse. Amazon Redshift può essere eseguito all'interno di Amazon VPC in modo da isolare il cluster del data warehouse in una rete virtuale a sé stante e collegarlo all'infrastruttura IT esistente tramite VPN IPsec con crittografia standard di settore.

Audit e conformità

Amazon Redshift si integra con AWS CloudTrail per creare audit di tutte le chiamate API di Redshift API. Inoltre registra tutte le operazioni SQL, inclusi i tentativi di connessione, le query e le modifiche ai database. Per accedere a questi log è possibile utilizzare query SQL su tabelle di sistema oppure scaricarle in un percorso sicuro su Amazon S3. Amazon Redshift è conforme ai requisiti di controllo SOC1, SOC2, SOC3 e PCI DSS Level 1. Per ulteriori informazioni, consulta Conformità di sicurezza nel cloud AWS.

440x220_APN-Blog

Pubblicare analisi comparative delle prestazioni fuorvianti è una tattica di marketing molto nota. Non sorprende che molte aziende della vecchia guardia vi si affidino spesso, ad esempio Oracle; siamo rimasti però sorpresi nel constatare che anche Google è caduta in questa trappola. Quando Google, durante un evento privato a San Francisco il 29 settembre 2016, ha presentato i risultati di un test che vedeva BigQuery fronteggiare Amazon Redshift, non potevamo non approfondire la loro analisi.

Leggi il post completo »

In questo post, Periscope presenta i risultati di un'analisi comparativa che coinvolge Amazon Redshift, Snowflake e Google BigQuery. 

Leggi il post completo »

Molti clienti di AWS ci hanno chiesto un modo per analizzare in modo programmatico i report di costo e di utilizzo. Spesso, questi clienti usano AWS su diverse linee aziendali e offrono un'ampia gamma di servizi distribuiti in diverse regioni. Poiché le informazioni che offriamo su fatturazione e costi sono molto dettagliate, non c'è niente di meglio di una soluzione AWS per i Big Data per analizzarle! Mentre ero in vacanza, all'inizio di questo mese, abbiamo lanciato una nuova caratteristica che consente di caricare i report di costo e di utilizzo in Amazon Redshift e Amazon QuickSight. Ora che sono tornato, vorrei parlarvi di questa novità.

Leggi il post completo »

Per visualizzare un elenco completo dei post del blog correlati ad Amazon Redshift, consulta questa pagina »

Per ulteriori informazioni su tutte le nuove funzionalità di Amazon Redshift, consulta questa pagina »

Prova Amazon Redshift gratis. Per 2 mesi avrai a disposizione 750 ore di nodo DC1.Large. Per iniziare la prova gratuita, crea un account AWS e accedi alla console di Amazon Redshift. Quindi avvia un cluster Amazon Redshift e seleziona il tipo di nodo DC1.Large.

 

Inizia ora