YouTube: Google usa redes neuronais para melhorar miniaturas

Vítor M.

9 anos ago

Redes neuronais, ou, mais propriamente, redes neuronais artificiais, são sistemas computacionais estruturados numa aproximação à computação baseada em ligações que imitam o mecanismo de processamento do cérebro humano.

A Google está a ensinar os seus algoritmos a usar redes neuronais para gerar as imagens miniaturas nos vídeos dos seus utilizadores no YouTube.

O vídeo que colocamos no YouTube é complementado por uma miniatura que mostra, ou tenta mostrar numa imagem, qual o tema, quem está presente ou algo que possa identificar o que vamos ver. Esta miniatura sendo mais ou menos atractiva permite que as pessoas vejam ou não aquele vídeo, pois a imagem é só por si a chave do sucesso de um conteúdo disponibilizado no YouTube.

Embora seja possível as pessoas colocarem a imagem que mais se adequa ao conteúdos, a grande maioria não faz isso e deixa ao YouTube o ónus de gerar uma miniatura de forma automática. Mas a Google quer tornar essa tarefa mais científica e objectiva.

Quando enviamos um vídeo para o YouTube, a Google selecciona automaticamente um quadro de cada segundo do vídeo conforme este vai sendo carregado e aplica à posteriori vários filtros para escolher bem, ter uma boa miniatura, algo que faça sentido.

Este processo tem falhas e nem sempre funciona de forma útil, alias podemos ver exemplos nesta imagem que a própria Google disponibilizou:

Agora o método será outros e podemos ver como o pretendem aplicar:

Ao contrário da tarefa de identificar se um vídeo contém o seu animal favorito, julgar pela qualidade visual de um quadro de vídeo que pode ser muito subjectivo – muitas vezes as pessoas têm diferentes opiniões e preferências na escolha de quadros como miniaturas do vídeo. Um dos principais desafios que enfrentámos foi a forma de recolher um grande conjunto de exemplos de treino bem sucedidos para alimentar a nossa rede neuronal. Felizmente, no YouTube, além de ter miniaturas geradas por algoritmos, tem também muitos vídeos com miniaturas personalizadas cuidadosamente projectadas e enviadas pelos criadores.

Basicamente, a Google recorrendo às miniaturas personalizadas como treino, permite que a sua equipa possa dar exemplos concretos, serve de treino intensivo para ensinar uma rede neuronal para esta “perceber” um pouco mais como pensam os humanos, principalmente o que os leva a escolher determinada imagem no momento de formar uma miniatura que identifique o conteúdo do vídeo.

A forma como actualmente o algoritmo já escolhe as imagens mostra que há uma evolução, tal como podemos ver em cima no exemplo que a Google disponibilizou no seu blog, contudo há ainda uma aprendizagem contínua porque os conteúdos são de tal forma abrangente que tudo pode desafiar a “inteligência” da rede neuronal artificial.

Hoje uma mecânica neuronal humana, amanhã um conjunto de acções… um dia o cérebro a funcionar de forma artificial.

Google Research