PplWare Mobile

Apache Hadoop – É hoje que vai instalar o seu primeiro cluster?

                                    
                                

Este artigo tem mais de um ano


Autor: Pedro Pinto


  1. Rolando Andrade says:

    Uma pergunta rápida, e talvez um pouco sem sentido, é possível acelerar processos de renderização em programas de modelação 3D com este tipo de sistemas?

    Obrigado

    • Pedro Pinto says:

      Sim, claro. Se tens mais poder de processamento conseguirás renderizações mais rápidas.

    • Frederico says:

      Uma boa hipótese para isso é não usares apenas os módulos de processamento do PC mas sim, usar também os módulos de processamento da placa gráfica. Os conhecidos GPU’s.

      Pode diminuir mais de metade do tempo de renderização. Dependendo, obviamente, das características do PC / PC’s em questão.

      Se tiveres conhecimentos para isso podes também “expandir para blocos de processamento externo”. Mas aí já requer conhecimentos de barramentos, conhecimento profundo da arquitectura dos módulos, etc.

      Basicamente fazeres uma aproximação de um supercomputador, no que diz respeito a renderizar.

      Por ultimo, claro que deve ser baixa a probabilidade de encontrares drivers / software de gestao desses módulos. uma vez que é uma coisa muito especifica.
      Por isso, firmware, software, drivers, terás que ser tu também a desenvolver.

    • 4knahs says:

      Não acredito que exista suporte para qualquer programa actual de modelação 3D correr em Hadoop MR.
      Por outro lado seria possivel aplicar o modelo Map-Reduce a renderização e há investigação a ser feita nesse sentido.
      Atencao tambem que mais poder de processamento muitas vezes não significa tempos de execucao menores em sistemas distribuidos. Muitas das tecnologias hadoop estão desenhadas para funções muito especificas. Um exemplo muito simples, um cluster HDFS (pelo menos antes de introduzirem o YARN) arrasta-se se usado para criação frequente de pequenos ficheiros.
      Cumprimentos

  2. Branets says:

    Fantastico….um assunto que não sei como o fazer, mas que tenho muita curiosidade em o por na pratica, material já tenho (5 rpis). Fico a aguardar os proximos artigos. Parabéns e obrigado

    • Pedro Pinto says:

      Em próximos artigos vamos adicionar nós ao cluster. Vamos também fazer tutoriais específico para o RPI, com base na nossa distro pipplware.

      • Mota says:

        *clap clap clap*

        Isto sim é o pplware que me lembro.

        Existe algo semelhante mas em Windows?

      • Miguel says:

        Pedro e é possível com cluster nas RPI poder usar o aumento de desempenho para navegar na web? (GPU yuotube) ou só estamos a falar de poder de processamento para calculo?

        • Miguel says:

          Queria dizer “youtube” isto é se tivermos a falar 5 RPI em clusterusamos a vantagem de 5 GPUs para visualização de video na Raspberry?

          • João MS says:

            same question here.

          • Pedro Catarino says:

            O hadoop faz parte de um ecossistema com spark, mahout, entre outros, que tem como objectivo processar grandes volumes de dados através do modelo mapreduce e aplicar técnicas de machine learning para descobrir informação. Não uma plataforma que vá aumentar o desempenho de todas as aplicações do SO, é mais uma ferramenta para ser usada por um cientista de dados.

        • Diogo Santos says:

          O Pedro Catarino já explicou como funciona o hadoop.
          Os browsers não são feitos a pensar em computação distribuída, portanto não terás vantagens se correres um browser num cluster de RPis. Pelo menos se o objectivo for ter melhor performance em vídeos embutidos.

  3. Joao Torres says:

    dá para minerar bitcoins com um cluster ?

  4. Joana says:

    Gostava de saber se é possivel criar uma render farm recorrendo a Raspberry Pi’s 2 ou 3.

    • Pedro Ferreira says:

      O ambari funciona muito bem quando tens maquinas fisicas e queres juntar tudo e fazer um cluster. Agora quando queres fazer um cluster recorrendo a virtualização não é grande espingarda porque nem sempre corre bem.

  5. Rui says:

    Podem me dizer se também é possível instalar o Apache Hadoop em Windows 10?

  6. Pedro Santos says:

    Muito bom tutorial, fico à espera do resto apenas pela informação extra 🙂

  7. Az8teiro says:

    A ideia está boa e aplaudo. O que não aplaudo é o momento em que o fizeram, isto não devia ser o primeiro, mas sim o segundo artigo, em que o primeiro era os fundamentos da computação distribuída e para que serve…

    Sendo isto não mais que um sistema de processamento distribuído, de nada adianta a todo o mundo saber instalar isto, se não sabem para o que serve sequer… É mais uma moda que depois passa tal como por exemplo as impressoras 3d que realmente têm utilidade para 10% dos compradores.

    Deviam primeiro ter explicado ás pessoas que isto serve para computação científica, calculo, processamento de grandes quantidades de informação, etc, por exemplo calcular rainbow-tables, passwords por brute-force, evolução de células, vírus e afins..

    Este tipo de sistemas não serve para utilização pessoal em tempo real, como jogos com o dobro dos fps, ou correr tudo ao máximo, ou ver vídeos em 10 x 4K… Isto não serve para isso. Uma forma muito simples de entenderem o objectivo disto, é se quiserem calcular os primeiros 100 Milhões de números primos, que com 1 RPI demora um ano, com 6 RPI demora 3 meses por exemplo (atenção valores inventados).

    A minha grande dúvida nestes projectos é sempre a utilidade que eu lhes daria, qual seria o proveito que eu conseguiria, e essa é sempre a minha maior dificuldade, porque instalar isto e perder umas horas ou uns dias, para depois não servir para nada, o tempo era mais bem empregue a dormir.

  8. Joao says:

    Como se instala um servidor web a partir deste ponto

Deixe um comentário

O seu endereço de email não será publicado.

You may use these HTML tags and attributes: <a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

Aviso: Todo e qualquer texto publicado na internet através deste sistema não reflete, necessariamente, a opinião deste site ou do(s) seu(s) autor(es). Os comentários publicados através deste sistema são de exclusiva e integral responsabilidade e autoria dos leitores que dele fizerem uso. A administração deste site reserva-se, desde já, no direito de excluir comentários e textos que julgar ofensivos, difamatórios, caluniosos, preconceituosos ou de alguma forma prejudiciais a terceiros. Textos de caráter promocional ou inseridos no sistema sem a devida identificação do seu autor (nome completo e endereço válido de email) também poderão ser excluídos.