Como o Gemini da Google vai facilitar a vida de utilizadores com problemas de visão e audição
No sentido de dispositivos mais acessíveis, a Google está a reforçar a funcionalidade Talkback com o Gemini, permitindo que a Inteligência Artificial (IA) facilite a navegação na web de utilizadores com problemas de visão e audição.
Os dispositivos Android oferecem uma funcionalidade de leitor de ecrã incorporada chamada TalkBack, que ajuda as pessoas com problemas de visão a compreender o que aparece no ecrã do telemóvel e permite-lhes controlá-lo com a voz.
Em 2024, a Google adicionou o Gemini, oferecendo aos utilizadores uma descrição mais detalhada das imagens.
Agora, conforme anunciou, está a tornar este recurso mais robusto, dando ao utilizador a possibilidade de fazer perguntas e ter uma conversa mais detalhada sobre o que está a ser mostrado.
Da próxima vez que um amigo lhe enviar uma fotografia da sua nova guitarra, pode obter uma descrição e fazer perguntas de seguimento sobre a marca e a cor, ou mesmo sobre o que mais está na imagem.
Exemplificou a Google, procurando alargar a acessibilidade dos dispositivos Android.
Google aproveita o Gemini para "legendas expressivas"
No Chrome, a Google está a dar um pequeno impulso às legendas geradas automaticamente para os vídeos, chamando-lhes "legendas expressivas".
Além das palavras de um comentador de futebol, por exemplo, as legendas fornecidas pelo Gemini informarão o utilizador sobre as suas emoções e expressões.
Ou seja, no cenário acima, em vez de "golo", os utilizadores com problemas auditivos verão um "gooooloooooo".
Ainda que estas "legendas expressivas" estejam a ser disponibilizadas nos Estados Unidos, Reino Unido, Canadá e Austrália, espera-se que cheguem, entretanto, a outros mercados.