Ciência obrigada a mudar nome de genes! A culpa é do Microsoft Excel
Qual a relação entre o Microsoft Excel e a ciência? Aparentemente nenhuma! No entanto, quando se fala em investigação científica, o Microsoft Excel pode ser uma excelente ferramenta de cálculo e gestão de números. Podemos produzir gráficos, relatórios entre outros elementos gráficos.
Recentemente os cientistas tiveram de mudar o nome de genes do DNA por causa do Excel! Saiba porquê.
Microsoft Excel "converte" nome de genes em datas
Alguma vez pensou que os automatismos do Microsoft Excel pudessem atrapalhar na ciência? Pois, é realmente isso que tem vindo a acontecer e nesse sentido os investigadores tiveram de mudar o nome de genes de DNA.
Quando se fala em genes de DNA são nomes como MARCH1 e SEPT1 que o Excel converte para data.
Para ultrapassar tal problema o nome do genes MARCH1 passa a chamar-se MARCHF1 e do SEPT1 passa a ter o nome SEPTIN1. Estas são algumas das sugestões do comité que tem como responsabilidade a atribuição dos nome dos genes.
THRILLED by this announcement by the Human Gene Nomenclature Committee. pic.twitter.com/BqLIOMm69d
— Janna Hutz (@jannahutz) August 4, 2020
Alterando o nome dos genes não é preciso proceder a alterações no Excel. Em 2004, um grupo de investigadores dedicados ao estudo do cancro publicou um artigo no qual referia que “as conversões dos dados [pelo Excel] afetam pelo menos 30 nomes de genes;
O Microsoft Excel é um dos melhores softwares de produtividade para trabalhar em folhas de cálculo. Apesar de todos os esforços, não há nenhuma ferramenta que possa ser considerada uma total alternativa ao software da Microsoft.
Este artigo tem mais de um ano
não era preciso isso
basta colocar um ‘ antes da expressão que o excel considera o input como texto
Isso é tudo muito giro mas apenas quando escreves manualmente e se te lembrares!
Se copias dados de outras fontes continua a dar problemas.
Pronto… Mais um “especialista” formado no YouTube.
Andas perdido, no meio de tanta gente bem mais inteligente que a grande maioria de nós, foste o único que pensou numa solução óbvia…
Oh Manuel!!
A tua veia científica está a desgastar-se neste Portugal. Ajuda lá a ciência mundial e a MS já agora.
Bom dia
Um script em python feito em 5 minutos ou menos resolve esse problema…
Para quê tanto ódio? O Manuel apresentou uma solução válida. Além de se desconhecer a formação do Manuel, não vamos descredibilizar os auto-didatas que muitas vezes sabem mais do que aqueles com estudos superiores, ademais, o youtube tem conteúdos educativos com bastante qualidade.
Agora só por sermos portugueses não podemos ter um conhecimento em determinada área melhor do que os estrangeiros? São cientistas, não são informáticos. Não me admiro que não conheçam técnicas como o escaping e outras maneiras de dar a volta a problemas como informáticos sabem.
Não lhe tenho ódio nenhum, aliás o script de que falo seria para implementar a solução dele.
É sempre possível formatar como texto ou por o “‘” antes do texto e problema resolvido. Tem de haver algo mais, no meio de tanto cientista e no Comité alguém há-de dominar o Excel e não me parece que o problema seja assim tão básico.
experimenta andar a copiar grande quantidade de dados e vê na confusão que dá.
E a partir do momento que o Excel formatar como data já não podes formatar para o texto original, a única solução é ver se ainda é possível desfazer a conversão feita pelo Excel, o que pode já não ser possível quando reparares no erro!
+1
Com a tecnologia que temos hoje, formatar data para o Excel não é um problema assim tão grande – ainda que cientistas não o saibam fazer, não parece ser um desafio complicado para um programador fazer um script que corrija o problema. Escolher mudar o nome dos genes foi a solução tomada por eles, não significa que seja a melhor. Não é por serem estrangeiros que são obrigatoriamente melhores que nós!
uau! Não fazia ideia que não havia cientistas portugueses!
Sim porque as pessoas o que querem é ter que andar a preocupar-se com scripts para corrigir os erros criados pela conversão automática do Excel de texto para um número (não é um mera formatação), erros que muitas vezes as pessoas nem reparam.
A melhor solução seria o Excel dar a possibilidade de controlar este comportamento, impedindo conversões automáticas.
O Excel foi criado para gerir diversos tipos de dados, não é vocacionado especialmente para dados científicos. Se este comportamento dificulta a conversão neste caso, para outros pode até facilitar. Logo se o Excel foi o programa escolhido para estes cientistas, cabe a eles adaptarem-se à ferramenta, e não a ferramenta aos cientistas. E entre ter os cientistas terem um programador que faça este script de adaptação, ou ter a Microsoft a adaptar para cada situação onde estes erros possam acontecer, acho que não é difícil perceber qual destas opções é mais descabida. Até porque o Excel já oferece uma solução a este problema, dita pelo Manuel que vocês imediatamente descartaram e ridicularizaram. Chamo a isso mesquinhice.
Francisco, foste tu que levantaste a questão qual era a melhor solução (não qual era menos descabida), e a melhor solução é a que disse, sendo que a ser uma opção não inviabilizaria em nada nenhum outro caso.
Aliás se há uma opção para nem sequer fazer cálculos automaticamente, não seria de todo descabido haver uma opção para não fazer conversões de dados – sendo que isso é bem mais problemático e não se aplica apenas a ciência, aplica-se a milhares de outros casos em que se usa texto.
A solução do Excel não se aplica quando andas a copiar dados, que é o que se faz muitas vezes, não tem nada de mesquinhice é a realidade do uso.
Devia ser a Microsoft a corrigir… Certamente são mais anos de estudo de ciencia do que de desenvolviemto do excel.
Se eu vou para uma aula e só tenho caneta vermelha o professor não me vai deixar fazer o teste com essa caneta, eu tenho de arranjar outra.
E vai queixar-se ao fabricante que o professor não o deixa usar a caneta ou vai à loja comprar uma diferente? Um exemplo que se explica sozinho…
E porque não usam libreoffice? Aqui dizem que e muito bom..oh irony
Usar o Excel num estudo científico?
Estes tipos precisam de uma reciclagem.
Com tanto software melhor, com linguagens e frameworks tão básicas de se usar, python à cabeça, ou R, e usam o Excel.
Parece mentira tal tristeza.
O último parágrafo que o Pedro Pinto escreveu… Epa, como é que é possível dizeres uma coisa destas? Eu até aceitava se fosse o Vítor, ou outro, agora tu?
O Excel é o melhor para trabalhar em folhas de cálculo? Mas o que são folhas de cálculo?
É uma matriz. Só isso, uma matriz, tbm conhecida pelos “especialistas” do Excel como dados tabulares.
Em qualquer linguagem de programação, das primeiras coisas que se aprende é a percorrer um array/lista/vector.
Linguagens super simples de se usar, como Python ou R, tem enormes quantidades de bibliotecas, frameworks para lidar com dados tabulares.
Qualquer uma das duas linguagens, tem montanhas de métodos matemáticos já feitos para tudo, e deixam a milhas o Excel.
E dizes tu que não há alternativa ao Excel?
Se instalarem o R studio até tens a visualização dos dados tabulares tal como vias no Excel, isto para quem não passa sem a questão visual.
Pedro, tens de ter mais atenção, porque estás a influenciar de forma negligente quem lê, e fica a pensar que realmente é como dizes.
@Complilador
Não há nenhuma alternativa ao Excel. O Excel é provavelmente a melhor ferramenta da Microsoft. E em quê? No poder de cálculo, na facilidade de usar, na importação/exportação de dados… o que falas é poderoso, mas não é para todos.
O R studio tem a mesma forma visual. Têm menus, tem fórmulas tal como o Excel ja prontas a usar.
Instala aí o R studio e depois compara com o Excel.
No caso da notícia, não é possível que cientistas tenham dificuldade em usar o R studio, porque para tarefas simples é tbm simples de usar, e para tar tas que englobam algum tipo de tratamento dos dados, ou algum tipo de método estatístico ou matemático, é muito mais simples de usar o E do que usar o Excel, já para não falar nas questões de limites no Excel, nas questões de falta de performance no Excel.
Melhor do que eu te tentar convencer, é instalarem o R studio e experimentas com coisas básicas que um utilizador num laboratório usa no Excel. Depois, tens a questão dos testes estatísticos, e tenta no Excel e tenta no E studio.
Depois de comparares, aposto que não consegues afirmar o que afirmas no último parágrafo.
E dava um belo post aqui no pplware, uma alternativa ao Excel, que é grátis, muito boa, visual tal como o Excel e que é tbm uma linguagem de programação, multiparadigma e com um enorme (gigante) acervo de métodos estatísticos para aplicar a dados.
Realmente… é tal e qual… a determinado momento nem sabia qual era o RStudio ou o Excel…
Enfim….
Já agora, deixo aqui um vídeo.
https://rstudio.com/resources/webinars/how-to-excel-without-using-excel/
Obrigado.
E a investigação científica ou trabalhar com genes é para todos?
Mas a formação das pessoas é em Biologia, Bioquímica, Medicina, etc. Não é em engenharia, física ou informática.
As pessoas usam as ferramentas que funcionam, que conhecem e que outros usam para poder colaborar.
Agora queres impingir a toda a comunidade científica o uso de outras ferramentas mais complicadas de usar, e sem saberes como é que as pessoas se organizam e o que sabem? Ainda por cima que tenham de aprender scripts, etc. Estamos a falar de ciências biomédicas, o que se quer é simples e rápido para organizar dados, e o Excel é bom para isso. Aliás há muitos aparelhos que até dão a opção de exportar dados directamente para Excel.
O Excel é apenas uma parte do que as pessoas podem usar. Para a análise estatística propriamente dita quase toda a gente usa outros programas.
Impingir? Impingir é querer usar algo fechado, que se pagam licenças como o Excel.
Aprender scripts? No Excel qualquer coisa que não seja aplicar directamente uma função, já cais no VBA.
Qualquer pessoa em biologia, bioquímica, biomedicina, engenharia biomédica etc, têm cadeiras de estatística, e usaram quase certamente o E, portanto não sabes do que falas.
Os aparelhos dão a opção de exportar dados que são tabelados, e podem ter como delimitadores o ; que é muito usual. Não existe essa coisa de exportar para Excel, existe só qual do o conhecimento sobre o assunto é super limitado.
Não é preciso ser de engenharia informática para usar o R, muito pelo contrário, é usado muito mais por bioquímicos, biólogos, engenharia biomédica, etc.
Não, não usaram ou aprenderam o E, e sei bem do que falo porque trabalho na área e também uso VBA e Python (o Python é muito bom e rápido, mas não se aplica a tudo, e para visualizar dados o Excel é mais fácil para boa parte das situações).
O mundo não gira em volta apenas do que conheces, há muitas mais ferramentas por aí do que imaginas. Exemplo duma muita usada e bem adaptada aos utilizadores em ciências biomédicas: GraphPad Prism. Outra também muito usado SPSS…
Não são muitas as pessoas se metem em VBA nesta área, nem sequer querem ouvir falar de tal coisa. Limitam-se às fórmulas do Excel.
O R é usado apenas por algumas pessoas nestas áreas, em termos relativos são poucas. E não disse que é preciso ser de engenharia para usar, falei que nesta área o normal é as pessoas procurarem ferramentas simples e rápidas de usar. São paradigmas diferentes.
Não era o E, infelizmente foi erro meu ao escrever no telemóvel, era R, mas garanto te que em engenharia biomédica, biomedicina e biologia, é comum usar nas cadeiras de estatística, R e SPSS em alguns casos.
O que chamas visualizar dados, se bem que não entendi o que esperas ver apenas olhando para valores numéricos a olho nu, é apenas um conforto visual, e isto se forem poucos dados, porque uma matriz com muitas linhas e colunas enormes, usares o Excel não é nada confortável, e para teres várias folhas (sheets), em que numa tens a matriz enorme e na outra tens os gráficos, mais as células com as fórmulas, não tem nada de conforto visual.
O que chamas visualizar, na realidade é atribuído a algum tipo de grafismo, seja de que tipo for, mas isso é apenas pós tratamento de dados, certo?!
Tratamento de dados no Excel fazes com recurso a que?
Não sei em que estudos particas ou que tipo de trabalho fazes, mas ou trabalhas com poucos dados ou de certeza nlque não usas o Excel, até pelas muitas limitações do mesmo.
O SPSS tem a questão das licenças, e em termos práticos, não tem vantagem em relação ao R.
E sim, o mundo não gira á volta do que conheço, mas no caso de tratamento de dados, análise e visualização, tenho suficiente conhecimento para te dizer que nem por sombras o Excel é ferramenta para qualquer tipo de trabalho sério, nem por questões de performance, nem por questões de melhor qualidade de tratamento de dados, nem de visualização, nem muito menos de análise.
Isto para não falar de questões de licença.
pois eu garanto-te que R e SPSS não é ensinado e usado em cadeiras de estatística nos cursos de Bioquímica, Biologia, Medicina, etc em Portugal, porque estamos a falar de cadeiras sem uma componente prática, são muito mais teóricas com alguns exemplos práticos dados pelos professores. E aquilo que é usado na maioria dos laboratórios não é R.
O Excel permite formatações de tabelas e de células segundo critérios, bem mais fácil de visualizar do que noutros programas. Para além disso é muito mais flexível já que uma folha não se resume a uma tabela, e podemos ter gráficos na mesma folha. Estamos a falar de compilação de dados ao longo do meses que demora um projecto, etc.
Tratamento de dados também pode ser feito no Excel. Tanta coisa que se faz num laboratório que não requer fazer uma análise estatística mas apenas fazer cálculos sobre os dados recolhidos…
Tal como já disse, bem comum nesta área para análise estatística é o Prism.
Tadeu, deixo aqui uma lista de cursos, bem perto de onde vive o Pedro Pinto.
Todos estes cursos têm estatística no plano de estudos e todos eles usam o R, alguns tbm usam o SPSS facultativamente.
Quanto a não terem uma componente prática, não sei onde estudaste, mas já passei por mais de uma universidade e é falso o que dizes, todas têm componente prática.
Lista de cursos:
https://www.ubi.pt/PlanoDeEstudos/915/1264/2019
https://www.ubi.pt/PlanoDeEstudos/25/1545/2020
https://www.ubi.pt/PlanoDeEstudos/904/1451/2020
https://www.ubi.pt/PlanoDeEstudos/816/1589/2020
Para que conste, conheço até pessoalmente os professores das cadeiras de estatística e/ou relacionadas dos cursos acima listados.
E não, não sou professor em nenhum dos cursos aí listados.
Engano meu relativamente à componente prática – já lá vai algum tempo. Mas a prática não envolvia computadores, muito menos R, eram exercícios para consolidar as noções de matemática.
Se verificares os programas das cadeiras de estatística em Bioquímica, Ciência Biomédicas, Biotecnologia, não tem qualquer parte que ensine o uso dessas aplicações, nem a bibliografia envolve R. Aliás num dos casos a bibliografia assenta no uso do Excel!
Tem noção que não é preciso computadores para ensinar estatística.
Para solucionar este problema… é só preciso colocar às células com o formato de texto…