Sabia que a sua “aquisição da linguagem pré-adulta” cabe numa disquete 1,44 MB?
Há estudos muito interessantes que convertem determinada informação em "medidas" que podemos facilmente entender. Segundo uma investigação, os humanos armazenam cerca de 1,5 megabytes de informação durante a aquisição da linguagem.
Desta forma, uma disquete de 1,44 MB chegava para guardar muito do que aprendemos até à idade adulta.
Tudo o que aprendemos até à idade adulta cabe numa disquete
Com a evolução da tecnologia e de conceitos relacionados com o ser humano, é possível fazer certas comparações. Entre essas comparações estão as feitas entre os mundos da ciência e da informática.
Nesse sentido, investigadores americanos calcularam que, da infância à idade adulta jovem, os aprendizes absorvem aproximadamente 12,5 milhões de bits de informação sobre a linguagem. São cerca de dois bits por minuto para adquirir plenamente o conhecimento linguístico.
Quando estes dados são convertidos em código binário, o espaço necessário para os armazenar é o de uma disquete de 1,5 MB (1,44 MB), segundo o estudo.
Tão pouco? Isso será fácil ensinar a um robô
As informações publicadas no site da Royal Society Open Science desafiam as suposições de que a aquisição da linguagem humana acontece sem esforço e que os robôs teriam facilidade em dominá-la.
O nosso estudo é o primeiro a colocar um número na quantidade que [os seres humanos] têm que aprender para adquirir a linguagem.
Isso destaca que as crianças e os adolescentes são alunos incríveis, absorvendo mais de 1 000 bits de informação por dia.
Explicou o principal autor do estudo, Steven Piantadosi, professor assistente de psicologia na Universidade da Califórnia, em Berkele.
Por exemplo, ao aprender a palavra “peru”, um jovem aprendiz normalmente recolhe informações perguntando: "Um peru é um pássaro? Sim ou não? Um peru voa? Sim ou não?" E assim por diante, até compreender o significado completo da palavra "peru".
O bit como unidade de comparação da aprendizagem humana
Em grosso modo, um bit, ou dígito binário, é uma unidade básica de dados na computação. Os computadores armazenam informações e fazem cálculos usando apenas zeros e uns. Assim, o estudo usa a definição padrão de oito bits para um byte.
Quando pensamos numa criança a ter que se lembrar milhões de zeros e uns (na linguagem), isso significa que eles devem ter mecanismos de aprendizagem realmente impressionantes.
Refre Piantadosi.
Na investigação, os especialistas procuraram avaliar as quantidades e os diferentes tipos de informação que os falantes de inglês precisam para aprender a sua língua nativa. Posteriormente, chegaram aos resultados executando vários cálculos sobre semântica e sintaxe de linguagem recorrendo a modelos computacionais. Surpreendentemente, o estudo constata que o conhecimento linguístico se concentra principalmente no significado das palavras, em oposição à gramática da linguagem.
Mas será fácil os robôs aprenderem ou afinal é mesmo complicado?
Os investigadores referem que muitas pesquisas sobre aprendizagem de idiomas concentram-se em sintaxe, como ordem de palavras. No estudo liderado por Piantadosi, foi mostrado que a sintaxe representa apenas uma pequena parte da aprendizagem da língua, e que a principal dificuldade é aprender o que tantas palavras significam.
Desta forma, o foco na semântica versus sintaxe distingue humanos de robôs. Além disso, esta metodologia também se aplica a ajudantes digitais controlados por voz, como Alexa, Siri e Google Assistant.
Isso realmente destaca a diferença entre aprendizagem de máquinas e aprendizes humanos. As máquinas sabem que as palavras andam juntas e para onde vão em frases, mas sabem muito pouco sobre o significado das palavras.
Referiu Steven Piantadosi.
Quanto à questão de se as pessoas bilingues devem armazenar o dobro da informação, Piantadosi diz que isso é improvável no caso de significados de palavras, muitos dos quais são partilhados entre os idiomas.
Os significados de muitos nomes comuns, como 'mãe', serão semelhantes entre os idiomas. Portanto, não precisamos de aprender todas as informações sobre os seus significados duas vezes.
Concluiu o investigador.
Este artigo tem mais de um ano
Fonte: UC Berkeley
E quando o nosso cerebro tem a memoria cheia é possivel desfragmentar ou formatar alguma partição? Quem sabe o segredo para o Alzeimer não está em trocar a disquete por um ssd.
🙂 Bem agora só falta, mesmo, pôr umas lentes de leitura ótica ligadas aos neurónios e abrir uma ranhura na cabeça, para enfiar um CD com a enciclopédia. 🙂
Diria : melhor seria pôr um modem ligado aos miolos e ter acesso à internet!
Ah tá… Conta outra…
Acho que a informação da minha linguagem já adulta deve caber numa disquete de 5″1/4.
Primeiro, “Tudo o que aprendemos até à idade adulta” não é apenas a linguagem. Segundo, a linguagem está interligada com praticamente tudo o resto da aprendizagem, não faz sentido separá-la. Por último, tirando a alta questionabilidade da conversão dos dados, a análise de linguagem natural é muito difícil precisamente por tudo o que esta envolve.
No foco, como diz no texto e no estudo, está a aquisição la linguagem.
Mas se separarmos as coisas, provavelmente os 1,5MB de informação só é suficiente para papaguear uma língua sem consciência do que a referida frase representa.
Imaginem um papagaio com um microSD de 128GB 😛
BTW, os perus voam?
Então afirmas que a haver um problema é no suporte de armazenamento? Não é dito que existe uma limitação no suporte.
Não sei se será assim. Acho muito interessante esta área, apesar de ser um mero curioso. Neste caso, “medir” o “tamanho” da informação é possível, como ilustra o texto e é sabido desde há muito.
Mas aqui há vários prismas para ver o mesmo assunto. Do ponto de vista da “medida” de cada palavra, em que a palavra sopa irá ter o mesmo tamanho de soma.
No entanto, quem já teve filhos, reparou que aos 2/3 anos, eles já sabem o que é uma sopa, sabem para que serve e alguns choram por ela (outros porque não a querem comer).
Já se fizermos a experiência de andar de volta do miúdo a tentar ensinar a soma, não vai acontecer a essas idades.
Portanto, só por aqui se tira que palavras que ocupam o mesmo número de bits, têm processos muito diferentes depois na formulação do pensamento. A construção cerebral do conhecimento, mesmo o da linguagem, está assente nas relações que o cérebro opera sobre todos os inputs que tem dos diversos sentidos, quer audição, quer visão e por aí fora.
Quando um pai ensina a soma ao filho, certamente usa dois brinquedos, ensina a contar, o miúdo vê um brinquedo e ouve a palavra um, depois vê outro brinquedo e ouve a palavra dois, e oi pai diz que 1+1 dá 2. Eu imagino que o cérebro não guarde isso de forma literal (até porque era muito ineficiente e era a forma menos optimizada de o fazer).
O processamento da linguagem natural, é altamente complexa, não decorre da medida em bits das palavras, são as relações das palavras e as abstrações que essas relações criam é que são complexas.
A publicação não explica, porque não foi esse o âmbito, de como medir as relações, até porque nunca li que alguém já tenha proposto algum tipo de formulação nesse sentido. O que nós todos já conhecemos das redes neuronais (no mundo da computação), são não correspondem exactamente ao funcionamento do cérebro humano, e mesmo nestas, feitas por nós, dependendo da rede, pode ser praticamente impossível sequer arranjar algum tipo de “razão” sobre o comportamento da mesma, muito menos sequer “medir” qualquer tipo de relação.
Aqui “medir” uma relação não é no sentido estrito, relações não se mexem aos “metros”, medir aqui é no sentido de arranjar uma forma de poder comparar relações a poder afirmar alguma coisa sobre isso.
Como exemplo visual da minha conversa (longa), já toda a gente leu uma frase de uma ou duas linhas, sabia o significado de cada palavra, mas não percebeu nada do que leu, e demorou tempo até perceber o total “alcance” da frase.
Claramente há métodos que são usados para poderem afirmar que existe uma medida. Fiquei mais curioso na questão do bilingue.
Quando li o titulo, pensei que iam falar do Paradise Café !!
Esses dados do cérebro na disquete são comprimidos em ARJ?
ARJ de MS-DOS não… nos dias que correm só se for em WINARJ ou WINRAR… os miúdos de hoje, de uma forma geral, já não sabem trabalhar em CLI… só mesmo por GUI… LLLLOOOOOLLLLLL