Estamos em busca de um Engenheiro de IA sênior para atuar alocado nas áreas de negócio do nosso cliente, desenvolvendo soluções pontuais de IA sob demanda, com o apoio do time interno de dados. O profissional será responsável por transformar necessidades das áreas em agentes inteligentes funcionais, desde a concepção até a entrega. Atuará como ponte entre as áreas de negócio e o time de dados, sendo responsável por entender os problemas de cada área, propor soluções baseadas em IA e executá-las de ponta a ponta.
Responsabilidades
- Desenvolver agentes autônomos utilizando frameworks como Agno, combinando múltiplas ferramentas em fluxos inteligentes.
- Criar agentes conversacionais com memória de curto e longo prazo, com rastreabilidade e personalização.
- Experimentar e integrar diferentes LLMs (OpenAI, Gemini, DeepSeek, entre outros), avaliando trade-offs de performance e custo para cada caso de uso.
- Estruturar e otimizar bancos vetoriais (ChromaDB, FAISS) e implementar técnicas avançadas de RAG conectadas ao Snowflake e sistemas internos.
- Implementar extração inteligente de dados via web scraping (Crawl4AI) e parsing de documentos complexos (Docling, Textract).
- Integrar agentes a APIs internas para que executem tarefas e atualizem sistemas de forma autônoma.
- Manter boas práticas de engenharia: código limpo, versionamento e documentação que permitam continuidade pelo time interno.
Requisitos
- Domínio de Python e bibliotecas voltadas a IA (Transformers, LangChain/Agno/LlamaIndex, scikit-learn, etc).
- Experiência com frameworks de agentes autônomos e arquiteturas de ferramentas.
- Experiência com ferramentas da AWS: S3, Lambda, ECR, SQS, Textract, EventBridge.
- Vivência em integrar LLMs de mercado em aplicações produtivas.
- Experiência com APIs (requests, FastAPI), manipulação de dados e conexão a bancos de dados.
- Vivência com bancos vetoriais para busca semântica e RAG.
- Vivência com Docker.
- Boas práticas de versionamento (GitHub) e arquitetura de soluções escaláveis.
- Conhecimento em deployment de LLMs em produção e prompt engineering.
Diferenciais
- Experiência em Machine Learning (supervisionado, não supervisionado e por reforço).
- Vivência com MLOps e automação do ciclo de vida de modelos.
- Conhecimento em otimização de LLMs.
- Experiência com IA conversacional integrada ao WhatsApp.
Aplicar-se a Vaga