Oferece o mais alto desempenho usando dados para conduzir melhores resultados de negócios. Empresa faz Cloudera Hadoop rápida, fácil e segura, para que você possa se concentrar em resultados.

Apache Hadoop

Hadoop é um ecossistema de componentes de código aberto que muda fundamentalmente a maneira como as empresas armazenar, processar e analisar dados. Ao contrário dos sistemas tradicionais, o Hadoop permite que vários tipos de cargas de trabalho analíticas para executar nos mesmos dados, ao mesmo tempo. CDH, plataforma de código aberto da Cloudera, é a distribuição mais popular do Hadoop e projetos relacionados do mundo (com suporte disponível via Cloudera Enterprise).

 Servidor

 Servir O armazenamento de dados distribuídos para Hadoop, HBase, apoia a rápida e aleatória lê / escreve ("rápida de dados"), necessários para aplicações online.

   

Armazenar

Arquitetura flexível infinitamente escalável do Hadoop (com base no sistema de arquivos HDFS) permite que as organizações para armazenar e analisar quantidades ilimitadas e tipos de dados todos em uma plataforma open source único em hardware padrão da indústria.

Modelo

Com o Hadoop, analistas e cientistas de dados têm a flexibilidade para desenvolver e interagir em modelos estatísticos avançados utilizando uma mistura de tecnologias parceiros, bem como estruturas de código aberto como faísca Apache e Apache Mahout.

 Processo

Integrar rapidamente com sistemas ou aplicações existentes para mover dados para dentro e para fora do Hadoop através do processamento de carga a granel (Apache Sqoop) ou streaming (Apache Flume, Apache Kafka).

Transformar dados complexos, em escala, usando várias opções de acesso a dados (Apache Hive, Apache Pig) para lote (MR2) ou rápida (Apache Faísca) de processamento in-memory. Dados do processo de streaming como ela chega em seu cluster via faísca Streaming. 

Descobrido

Analistas interagir com dados full-fidelidade na mosca com Impala, o banco de dados analítico para Hadoop. Com Apache Impala (incubação), os analistas enfrentar desempenho BI-SQL qualidade e funcionalidade além de compatibilidade com todas as principais ferramentas de BI.
Usando a pesquisa Cloudera, uma integração do Hadoop e Apache Solr, os analistas podem acelerar o processo de descobrir padrões nos dados em todas as quantidades e formatos, especialmente quando combinados com Impala

 

 

Apache Hadoop

Uma parte integrada do CDH e apoiou com Cloudera Enterprise Spark é o padrão aberto para processamento flexível de dados na memória para o lote, em tempo real, e análises avançadas. Através da iniciativa One Platform, Cloudera está empenhada em ajudar o ecossistema adotar faísca como um substituto para o MapReduce no ecossistema Hadoop como o mecanismo de execução de dados padrão para cargas de trabalho analíticas.

 A Iniciativa Um Platform

Apache Spark é bem posicionada para substituir MapReduce como o motor de processamento de dados padrão no ecossistema Hadoop, mas para os clientes a abraçar plenamente faísca para todas as cargas de trabalho de produção, ainda há trabalho a ser feito para torná-lo de nível empresarial. A Iniciativa Um Platform é a força motriz por trás da baliza comunidade de alcançar esse objectivo.

Para alcançar esta visão, committers da Cloudera, trabalhando ao lado da comunidade, irá abordar especificamente as questões mostradas no diagrama para a direita (com alguns itens já realizados).

 

Cloudera Navigator Optimizer

Otimização de dados ativo para Hadoop

Cargas de trabalho ineficientes custar-lhe tempo e dinheiro. Cloudera Navigator Optimizer fornece insights imediatos em suas cargas de trabalho e recomenda estratégias de otimização para obter os melhores resultados com o Hadoop.

 

 

 Obter uma visão instantânea em sua carga de trabalho atual

  • Navigator Optimizer usa o seu SQL existente para fornecer uma visibilidade abrangente em três aspectos-chave de suas cargas de trabalho:
  • Quais as consultas são os mais críticos
  • Que os dados são acessados ​​com mais freqüência
  • Como estes dados superior é usado

Informado orientação para a sua estratégia Hadoop

Painel de controle intuitivo do Navigator Optimizer transforma essa informação em uma estratégia de otimização completa, garantindo a carga de trabalho é otimizada para o sistema certo para melhor desempenho e eficiência com Hadoop.

 

Identificar as duplicações

 Expor complexidade

 Compatibilidade Leverage

 

Melhorar o desempenho da carga de trabalho facilmente detectar a duplicação e recomendar as principais consultas para otimizar.

 

Maximizar as suas oportunidades de otimização expondo padrões de acesso complexas que fazem o melhor uso da arquitetura do Hadoop.

 

Reduzir o tempo de desenvolvimento, aproveitando compatibilidades consulta existente com ferramentas Hadoop Hive e como Impala e obter orientação para regravações de consulta.

 

Trabalhando Hadoop Cloudera fácil com o Gerenciador

Implantação e configuração automatizada. A maneira mais rápida de se levantar e funcionando com Hadoop Cloudera e Empresa. Assistentes automatizados permitem que você implantar rapidamente o seu cluster, não importa o que a escala ou o ambiente de implementação, completa com as configurações padrão inteligentes com base em seu sistema. Através de uma interface centralizada, sua equipe de operações pode facilmente ajustar configurações e recursos; gerenciar uma ampla gama de funções de usuário para acesso self-service interdepartamental; e até mesmo gerenciar vários clusters para ambientes multi-tenant.

Monitorização e comunicação personalizável. Obtenha visibilidade completa de seu cluster com centenas de built-in controlos sanitários e alertas que podem ser configuradas com base no que mais importa para você. Não apenas você pode monitorar todos os componentes em todos os grupos (incluindo Cloudera si Manager), você também pode monitorar facilmente postos de trabalho e desempenho da consulta. Cloudera Manager tem única painel personalizável do setor, com a capacidade de criar gráficos avançados para monitoramento e personalizados gatilhos e limites históricos para o seu ambiente.

Sem esforço, solução de problemas robusta. A única gerenciamento centralizado de logs agrega registros em todos os serviços e hosts, e torna-los pesquisáveis para solução de problemas simples, incluindo integrado, costume alertando para os erros que você gosta. Visões históricas e métricas permitem que você veja exatamente o que aconteceu quando, e permitir que você veja rapidamente comportamento anomalistic. Suporte Cloudera também está diretamente integrado com o Gerenciador de Cloudera, para suporte proativo e resolução de problemas com base em seu sistema e logs.

Manutenção downtime zero. Nunca se preocupe com o tempo de inatividade do sistema com automações abrangentes para upgrades e rollbacks rolando para que você sempre terá os mais recentes avanços sem o incômodo . Alta disponibilidade através de componentes e construído em backup e recuperação de desastres significa que você pode executar até mesmo as suas cargas de trabalho mais críticas, livre de riscos.

 

Rápido, fácil e seguro

 

 

Para as organizações que querem nível empresarial Hadoop, Cloudera Enterprise é a escolha inteligente. Nossa plataforma combina o melhor do ecossistema Hadoop de alta performance com ferramentas empresariais e de apoio que fazem Hadoop simples de gerenciar e proteger a escala nos ambientes mais exigentes.

Rápido

 

 

Desempenho é a chave para libertar o potencial de dados ilimitados. Com as mais poderosas estruturas de acesso de código aberto, como Apache spark para processamento de dados amigável para desenvolvedores e Apache Impala (incubação) para alto desempenho SQL, você poderá obter resultados mais rapidamente com Cloudera empresa do que com qualquer outra plataforma de dados. Cloudera inclui também a única Hadoop Motor de busca nativo e fornece otimização de dados ativo.

Seguro

 

 

Com mais dados e mais acesso vem mais risco. Cloudera Navigator oferece tudo o que sua organização precisa manter os dados confidenciais e seguras e atender aos requisitos de conformidade. Parceiros Cloudera com Intel e dentro da comunidade para oferecer segurança sem comprometer a flexibilidade ou desempenho. Líder financeiro, de telecomunicações e instituições governamentais a confiança do mundo Cloudera Enterprise para proteger seus dados confidenciais.