Apache Spark

 

Apache Hadoop

Uma parte integrada do CDH e apoiou com Cloudera Enterprise Spark é o padrão aberto para processamento flexível de dados na memória para o lote, em tempo real, e análises avançadas. Através da iniciativa One Platform, Cloudera está empenhada em ajudar o ecossistema adotar faísca como um substituto para o MapReduce no ecossistema Hadoop como o mecanismo de execução de dados padrão para cargas de trabalho analíticas.

 A Iniciativa Um Platform

Apache Spark é bem posicionada para substituir MapReduce como o motor de processamento de dados padrão no ecossistema Hadoop, mas para os clientes a abraçar plenamente faísca para todas as cargas de trabalho de produção, ainda há trabalho a ser feito para torná-lo de nível empresarial. A Iniciativa Um Platform é a força motriz por trás da baliza comunidade de alcançar esse objectivo.

Para alcançar esta visão, committers da Cloudera, trabalhando ao lado da comunidade, irá abordar especificamente as questões mostradas no diagrama para a direita (com alguns itens já realizados).