Apple está a ensinar a IA a editar fotos como um humano!

A Apple não é de todo, uma das fabricantes de smartphones de destaque no lado da Inteligência Artificial. A gigante Norte-Americana continua a preparar terreno para entrar a sério na corrida, e apesar de algumas melhorias, é notório que a coisa não está a correr bem.

Mas, da mesma forma que o Gemini da Google apareceu em má forma na altura do seu lançamento e agora já começa a mostrar alguns sinais de competência, a Apple também está a tentar mudar o jogo, e ao que tudo indica, com algumas decisões inteligentes.

A mais recente pista veio de um novo artigo científico publicado pela própria empresa, onde revela como está a treinar IA para editar imagens da mesma forma que um humano faria.

O projeto chama-se Pico-Banana-400K e mostra que a Apple está muito mais avançada neste campo do que aparentava.

IA que percebe o que queres fazer numa imagem, e como tal, faz tudo sozinha!

O estudo descreve um modelo capaz de compreender instruções em linguagem natural, como “corta a imagem”, “muda o fundo”, “acrescenta uma cadeira” ou “ajusta o equilíbrio de cores”, e executar essas edições de forma realista e simples.

Para isso, a Apple usou cerca de 400 mil exemplos de edições de imagem guiadas por texto, combinando três sistemas distintos:

  • Nano-Banana, o modelo responsável pelas próprias edições.
  • Gemini-2.5-Flash, que gera as instruções de edição.
  • Gemini-2.5-Pro, que avalia a qualidade do resultado final.

No total, foram testados 35 tipos de edição, desde alterações de cor e estilo até à adição de objetos ou texto. O resultado? As edições de estilo foram as mais consistentes, enquanto as que envolvem mover objetos ou mexer em texto ainda apresentam falhas.

O que isto pode significar para o futuro do iPhone?

Atualmente, a Apple já oferece algumas ferramentas baseadas em IA, como o Clean Up (para remover elementos das fotos) e o Image Playground. Mas este novo trabalho aponta para algo bem maior, e de facto mais interessante. A possibilidade de a Siri passar a editar imagens com comandos diretos de voz.

Imagina dizer “Siri, melhora esta foto e ajusta a luz do rosto” e ver o resultado em segundos.

Além disto, o conjunto de dados poderá servir para treinar os futuros modelos multimodais da Apple, permitindo uma compreensão mais natural do que o utilizador quer ao editar uma imagem.

🔥 Este artigo foi útil?


Sê o primeiro a votar 🙂

Precisamos dos nossos leitores. Segue a Leak no Google Notícias e no MSN Portugal. Temos uma nova comunidade no WhatsApp à tua espera. Podes também receber as notícias do teu e-mail. Carrega aqui para te registares É grátis!

A ferver

Nuno Miguel Oliveira
Nuno Miguel Oliveirahttps://www.facebook.com/theGeekDomz/
Desde muito novo que me interessei por computadores e tecnologia no geral, fui sempre aquele membro da família que servia como técnico ou reparador de tudo e alguma coisa (de borla). Agora tenho acesso a tudo o que é novo e incrível neste mundo 'tech'. Valeu a pena!

Em destaque