Repositório utilizado na disciplina de IA.
src/rl/– agentes de Q-Learning (tabular, aproximação linear e rede neural/experience replay) e utilitários de ambientes Gymnasium.src/llm/,src/multiagent/,src/genai/– exemplos voltados para modelos de linguagem e agentes.notebooks/– materiais de apoio em Jupyter.requirements.txt– dependências gerais do repositório.
Cada subdiretório relevante contém um README específico com detalhes adicionais (por exemplo src/rl/README-qlt.md, README-qll.md, README-qln.md).
-
Criar o ambiente
conda create -n gcc1734 python=3.10 conda activate gcc1734
Se preferir, use
python -m venv .venv && source .venv/bin/activate. -
Instalar dependências
pip install --no-build-isolation -e .- Caso não queira a instalação editável, use
pip install -r requirements.txt. - Adicione
--userse encontrar problemas de permissão.
- Caso não queira a instalação editável, use
-
Verificar
python -m rl.ql_train --help
-
Todos os comandos abaixo devem ser executados a partir da raiz do projeto (
~/ailab/gcc1734) depois de ativar o ambiente e instalar o pacote. -
Treinar agente tabular Taxi-v3
python -m rl.ql_train --agent tabular --env_name Taxi-v3 --num_episodes 8000
-
Treinar agente neural (MLP + replay)
python -m rl.ql_train --agent neural --env_name Taxi-v3 --num_episodes 5000 --plot
-
Executar agente treinado
python -m rl.ql_play --agent tabular --env_name Taxi-v3 --num_episodes 5
-
Executar notebooks
jupyter notebook
Arquivos gerados (modelos .pkl, curvas .png) ficam na raiz do projeto por padrão.
- Crie uma branch para suas alterações.
- Garanta que scripts/notebooks rodem antes do commit.
- Abra um pull request descrevendo o que foi alterado.
Códigos e materiais podem ser reutilizados livremente para fins acadêmicos e de ensino.�