SOFA – Uma alternativa ao SPSS para análise estatística
Recentemente em conversa com um colega da área da contabilidade, ele questionava-me se eu conhecia alguma aplicação gratuita para análise estatística de dados. Neste segmento o SPSS (Statistical Package for Social Science) é considerado o melhor dos melhores, mas apesar de ser poderoso é pago e caro. Lembrei-me então que em tempos tinha visto um software com um nome engraçado e que talvez cumprisse os requisitos que ele necessitava.
Apresentei-lhe o SOFA (Statistics Open For All) e ele ficou simplesmente maravilhado com as funcionalidades que o software oferece. Vamos conhecer alguma dessas funcionalidades.
O SOFA é uma aplicação bastante completa para análise estatística e criação de relatórios com gráficos. Esta super aplicação é gratuita, e está disponível para Windows, Linux e MacOS.
Introdução/edição/eliminação de dados
O SOFA oferece um interface user-friendly que permite aos utilizadores introduzirem, editarem e eliminarem dados estatísticos, assim como alterar o nome de campos, tabelas, etc . Além disso, existe ainda a possibilidade de importar dados a partir de ficheiros .csv, Excel, Google Docs, Open Office, etc.
Criação de gráficos atractivos
Com base nos dados estatísticos, o SOFA permite aos utilizadores criarem vários tipos de gráficos bastante atractivos e com excelentes detalhes. Além disso, o utilizador pode exportar essa informação para HTML e assim publicar facilmente num site. Os gráficos são interactivos, sendo apresentadas várias informações quando passamos o rato por cima. Podem ver aqui um Demo
Escolha do teste estatístico
O SOFA oferece a possibilidade de realizar vários tipos de testes estatísticos.
Vejam o SOFA em acção
Esta aplicação impressionou-me pelo interface e funcionalidades que oferece ao utilizador. Para quem procura um ferramenta para análise estatística e que produza gráficos bastante interactivos, o SOFA é sem duvida uma excelente aplicação. O SOFA permite a criação de base de dados para guardar a informação, tendo suporte para o MySQL, Microsoft Access, SQLite, PostgeSQL, e Microsoft SQL Server.
Já disse que é gratuito? Pois, a página do projecto já registou mais de 45.000 mil downloads.
Para quem pretender instalar no Ubuntu, está disponível o .deb aqui
Licença: GPL
Sistemas Operativos: Windows/Linux/MacOS
Download: [Windows] sofastats-1.0.5_for_win.zip (41MB)
Download: [Ubuntu] sofastats-1.0.5-1_all.deb (1.1MB)
Download: [Mac] sofastats-1.0.5_for_mac.dmg (85MB)
Download: [Other] sofastats-1.0.5.tar.gz (1.3MB)
Homepage: Sofastatistics
Este artigo tem mais de um ano
https://www.youtube.com/watch?v=QiY8QB1fNAY&feature=player_embedded
Parece ser “user-friendly”, no entanto, não parece tão poderoso como a linguagem R. Uma boa alternativa é o gretl.
Ainda que não seja tão poderoso, é sempre bom ter uma opção “user-friendly” ao R.
Se utilizares o package Rcmdr ficas com o R mais user-friendly.
Saiu nova versão 1.0.6
Ora bem, aqui está uma boa surpresa! Há muito tempo que andava à procura de uma alternativa para o excelente GraphPad Prism, e embora este SOFA ainda não tenha muitas das suas funções, tem já uma interface intuitiva.
Faltam claro muitos testes, não encontrei por exemplo a ANOVA bifactorial, e não gosto muito da forma como ele avalia a normalidade de uma distribuição, prefiro os testes de Komolgorov-Smirnov ou Shapiro-Wilk, mas se o desenvolvimento do programa continuar a um bom ritmo, podemos ter aqui um excelente programa.
Claro que o R é muito mais poderoso, também o uso de vez em quando, mas o R é para quem realmente sabe e eu no R não faço grande coisa (tenho até uma cadeira na universidade só sobre o dito R à qual chumbei por isso…)
Em suma, isto já devia estar nos repositórios do Ubuntu e demais distribuições.
Boas. Este programa seria absolutamente impecável para a tese que estou a fazer com testes com utilizadores e vou então precisar de fazer a análise estatística depois dos testes. Portanto, Sofa impecável para mim.
O problema mete-se quando o instalo com as bibliotecas todas que ele pede e corre tudo bem. Mas depois tento corrê-lo e simplesmente não acontece nada. Será por estar a correr em 64bits? Mas para isso a instalar o python já teria dado erro não? Não percebo isto. Isto era o melhor que me podia aparecer e agradeço-vos pela notícia mas não consigo correr o programa de todo.
Alguém tem alguma ideia?
Obrigado!
Ideia não tenho, tenho é o mesmo problema 😡
Mas estou a correr 32bits (Windows XP)
Este programa seria útil, mas não o consigo abrir.. na instalação, tal como ao Raul, não originou qualquer erro.
Boas, eu tenho a correr no Windows 7 – 64bits, sem qualquer problema. O Sofa instalou o python, sqlite e mais algumas coisas. Aparece algum erro?
No meu caso não aparece absolutamente nada.. duplo clique no icon e nada acontece.
Eu deparo-me com o mesmo problema em dois PC’s com Wind 7 64bits.
Em ambos os casos não houve qualquer erro na instalação. Quando clico no icon nada. Na realidade na pasta de instalação não há qualquer ficheiro executável.
Tenho o mesmo problema, o start.pyw não corre.
Interessante era ter esta aplicação há uns 8 anos atrás… o que eu bati com a cabeça com a versão de então do SPSS…
Nem é bom lembrar 😀
.. para usar algo semlhante ao SPSS open source existe o PSPP: http://www.gnu.org/software/pspp/… infelizmente, as opções de análise são ainda (tão) limitadas quanto as do Sofa… Mas para quem não puder pagar o SPSS…
Já agora para quem estiver aflito com a estatística em SPSS pode usar este livrito (são só 900 e tal páginas): http://www.reportnumber.pt/ae
Fiquem bem
Bom artigo apesar do melhor dos melhores não ser o SPSS mas sim o SAS. 🙂
Para quem estiver interessado em analises econométricas devoa experimentar o Eviews, que também é pago.
Boas
A ferramenta é interessante, mas neste caso existe também ferramentas OLAP (On-line Analytical Processing), são idênticas a apresentar os dados e podemos utiliza-las também para dados estatísticos, são é um bocadinho complexas de trabalhar pois temos de utilizar linguagem MDX.
Neste momento estou a utilizar o Pentaho e o icCube ambas open source.
Aqui fica mais um utilizador que instalou o programa mais “os extras todos” e vai para correr aplicação e nada acontece.
Temos pena…
Faltou-me dizer que estou a correr o windows 7 – 64bits
Tive o memso problema e resolvi com uma pesquisa no site.
Aqui fica o link para a solução que encontrei e resolveu o problema:
http://www.sofastatistics.com/wiki/doku.php?id=help:will_not_start
Obrigado. Irei dar uma vista de olhos ao link assim que estiver com o meu computador.
Alguem conhece algum software que permita trabalhar com datasets enormes(CSVs com mais 2GB)?
Em R o RCmdr é relativamente fácil de usar.
Podem ver em http://tratamentoestatistico.com/programar.html as instruções para a sua instalação.
O Sofa não dava para fazer algumas coisas mais avançadas.
Em Pentaho cheguei a trabalhar em ficheiros com 13 milhões de chamadas pelo que penso que permita pegar em ficheiros grandes com mais de 2 Gb. Faz o processamento por linha. Podes ligar a bases de dados Oracle, Informix e outras. Só a ligação a ficheiros de Access fica um pouco mais lenta.
Existe um ponto onde conseguir trabalhar com o volume de dados é mais importante que as funções de base que se tenham.
O Pentaho também facilita a documentação das transformações efectuadas.
Existem alguns editores preparados para trabalhar com ficheiros com mais de 2 Gb como o winvi o que nalguns casos permite partir o ficheiro.
Desde ja agradeço a sua resposta Paulo Santos.
No R cheguei a testar com a package “bigmemory” e “biganalytics”, mas não consegui, não sei se permite, trabalhar com algums algoritmos disponiveis no R, como por exemplo o Genetico, Apriori, etc., pois estas packages so permitem usar os algoritmos disponiveis nas mesmas.
Alguem sabe se o Weka ou o Rapid Miner permite trabalhar com ficheros com mais de 2GB?