As apps das Smart TVs podem estar a fazer mais do que apenas mostrar séries e filmes. Ou seja, segundo novos estudos de mercado, algumas estão discretamente a usar a tua ligação à internet para recolher dados da web destinados ao treino de modelos de Inteligência Artificial.
Como? Porque tu permites. Ou seja, ao dizer que sim às caixas de texto que aparecem a pedir autorização, mas que tu nunca lês.
Smart TVs podem estar a ser usadas para recolher dados para IA
Portanto, empresas especializadas em web scraping, ou seja, recolha massiva de conteúdos públicos da internet, estão a crescer a um ritmo impressionante. O motivo é simples e faz todo o sentido. As empresas de IA estão desesperadas por dados para treinar modelos e LLMs.
Uma dessas empresas é a Bright Data, que opera uma rede global de proxies para recolher conteúdos públicos da web. Segundo o relatório, código associado ao Bright SDK foi encontrado em algumas aplicações de Smart TV.
O modelo funciona assim. O utilizador aceita os termos. A app ativa um SDK em segundo plano. A tua ligação residencial passa a poder ser usada para encaminhar tráfego web. Os dados recolhidos são depois enviados para os servidores da empresa e vendidos a companhias de IA para treino de modelos.
Consentimento existe, mas visibilidade? Muito reduzida
A Bright Data afirma que a participação é consensual e que o utilizador pode sair do programa em qualquer momento através de um processo simples. A empresa garante também que o SDK só entra em ação quando os recursos locais não estão a ser significativamente utilizados.
O problema é outro. A maioria dos utilizadores não tem qualquer noção da quantidade de tráfego que pode estar a passar pela sua ligação enquanto vê televisão ou navega na web. E como a atividade é distribuída por milhões de IPs residenciais, torna-se difícil de monitorizar.
Segundo a própria empresa, a sua rede inclui cerca de 150 milhões de clientes de crawling, incluindo Smart TVs, PCs e dispositivos móveis.
Comparações com redes desmanteladas
O relatório compara o modelo da Bright Data com o IPIDEA, uma enorme rede de proxies baseada na China recentemente desmantelada pela Google.
Enquanto os críticos alertam que este tipo de rede distribuída pode sofrer abusos para fins maliciosos, a Bright Data defende que a sua plataforma tem como objetivo uso para acesso legítimo a dados públicos e investigação.
Ainda assim, as grandes plataformas parecem estar a apertar o cerco.
Google e Amazon começam a restringir
A Google terá começado a proibir apps que mantenham SDKs persistentes a correr em segundo plano. A Amazon também já tomou medidas contra aplicações que dependem de mecanismos de proxy de terceiros como o Bright SDK.
Apesar disso, a empresa continua a manter parcerias com ecossistemas de Smart TVs baseados em Tizen OS e webOS, onde centenas de aplicações poderão estar a integrar este tipo de funcionalidade.
No fim do dia, a questão é simples…
Em suma, se estás a pagar menos publicidade ou tens acesso gratuito a streaming em troca de “consentimento”, será que sabes realmente o que estás a dar em troca? Em suma, a tua Smart TV pode não estar apenas a ver conteúdos contigo. Pode estar também a ajudar a treinar a próxima geração de modelos de Inteligência Artificial.








