Skip to content
This repository was archived by the owner on Dec 20, 2025. It is now read-only.

davidsantana06/ai-evaluation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

42 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AI Evaluation

AI Evaluation — Uso

AI Evaluation é uma aplicação dedicada à análise comparativa de imagens geradas por diferentes IAs. Para isso, quatro modelos distintos foram selecionados. Cada um deles cria imagens a partir do mesmo prompt, e cabe a você avaliar qual foi o melhor, por meio do seu voto.

Após a avaliação, os resultados ficam disponíveis para visualização, mostrando quais serviços tiveram o melhor desempenho. Além disso, você pode comparar sua avaliação com a do próprio ChatGPT, que também analisa as imagens geradas.

Python Flask Jinja

JavaScript HTML5 CSS3 Bulma

Font Awesome SQLite

💡 Modelos de IA Selecionados

Plataforma Modelo(s) Documentação
OpenAI dall-e-3 e gpt-4.1 platform.openai.com/docs/overview
Google AI gemini-2.0-flash-preview-image-generation ai.google.dev/gemini-api/docs
Runware civitai runware.ai/docs/en/getting-started/introduction
Stability AI stable-image-core platform.stability.ai/docs/getting-started

Os modelos e suas documentações podem ser atualizados após a construção do projeto. As informações apresentadas são referentes ao período de junho de 2025.

🛠️ Instalação e Execução

A aplicação foi desenvolvida em Python 3.10, recomendando-se o uso dessa versão para garantir compatibilidade. Para configurá-la, siga estas instruções a partir do diretório raiz do projeto.

1️⃣ Configurar as Variáveis de Ambiente

Antes de instalar e executar a aplicação, é necessário configurar as chaves de acesso aos serviços de IA como variáveis de ambiente. Para isso, crie um arquivo .env, com base no .env.example, e atribua os valores de GEMINI_KEY, OPENAI_KEY, RUNWARE_KEY e STABILITY_AI_KEY.

2️⃣ Instalar as Dependências

pip install -r requirements.txt

3️⃣ Executar a Aplicação

python -m app

As imagens são geradas durante a primeira inicialização do servidor, o que causa um tempo de espera maior. Esse processo ocorre apenas uma vez, a menos que a base de dados seja apagada.

🚀 Fluxo de Funcionamento

A aplicação funciona por meio de três etapas principais que ocorrem sequencialmente e são interdependentes.

🖼️ Geração das Imagens

Na primeira execução da aplicação, o arquivo generation_entries.json é lido para resgatar os atributos group, theme e prompt. A partir dessas informações, são feitas requisições para cada serviço de IA em ordem aleatória. As imagens geradas são salvas no banco de dados SQLite, situado na raiz do projeto, e armazenadas como arquivos PNG no diretório static/img.

Se o banco de dados apresentar registros de imagem, essa etapa é ignorada em execuções futuras.

🤖 Avaliação do ChatGPT

Após a geração, as imagens são avaliadas pelo ChatGPT. Elas são agrupadas e enviadas sem o nome do modelo gerador, contendo apenas o identificador e o conteúdo binário. Para cada grupo, uma imagem é escolhida como a melhor, e o resultado é registrado no banco de dados.

Essa etapa também é ignorada em execuções futuras, caso já exista algum registro de avaliação feita pelo ChatGPT.

👤 Avaliação do Usuário

Com as imagens e avaliações do ChatGPT prontas, o usuário pode acessar a interface da aplicação e votar nas melhores imagens por prompt. O processo é intuitivo e ao final é possível visualizar:

  • Quantidade de votos por IA (ChatGPT e usuário);
  • Tamanho total e médio das imagens por IA;
  • Tempo total e médio de geração por IA.

⚖️ Licença

Este projeto utiliza a Licença MIT, que permite que você use e modifique o código como desejar. O único requisito é dar o devido crédito, reconhecendo o esforço e o tempo dedicados à sua construção.

About

Aplicação web que compara imagens de IAs com base em avaliação humana e métricas do ChatGPT.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors