Machine Learning (ML) é um subcampo da Inteligência Artificial (IA) que se concentra no desenvolvimento de algoritmos e modelos estatísticos. Estes modelos permitem que os sistemas de computadores melhorem seu desempenho em uma Tarefa (T) específica, através da Experiência (E), medida por alguma Métrica de Desempenho (P).
Esta definição é frequentemente resumida pela tríade (T, E, P):
- T - Tarefa (Task): A função que o modelo deve aprender.
- Exemplos: Classificação de imagens, Regressão de preços.
- E - Experiência (Experience): Os dados de treinamento (conjuntos de dados) fornecidos ao modelo.
- P - Métrica de Desempenho (Performance): A função de custo que quantifica o erro do modelo.
- Exemplos: MSE (Erro Quadrático Médio) para Regressão; Acurácia, Precision, Recall e F1-Score para Classificação.
Um Modelo de Machine Learning é um artefato de software que encapsula uma função matemática, treinada a partir dos dados (E), para calcular um valor de saída (output) com base em um ou mais valores de entrada (input). Ele é o resultado final do processo de aprendizado.
Existem três categorias principais de algoritmos de ML, além do Semisupervisionado:
| Categoria | Descrição | Dados de Treinamento |
|---|---|---|
| Supervisionado | Aprende a partir de dados com as respostas corretas (rótulos). | Com Rótulos Conhecidos |
| Não Supervisionado | Identifica padrões e estruturas em dados sem respostas conhecidas. | Sem Rótulos |
| Por Reforço | Aprende por tentativa e erro, maximizando recompensas em um ambiente. | Sistema de Recompensa/Penalidade |
O Aprendizado Supervisionado é o termo geral para os algoritmos nos quais os dados de treinamento incluem Valores de Recurso (Features) e Valores de Rótulo (Labels) conhecidos. O objetivo é mapear a relação entre os recursos e os rótulos.
-
Regressão (Regression): O rótulo previsto pelo modelo é um valor numérico contínuo.
- Exemplo: Previsão do preço de uma casa.
-
Classificação (Classification): O rótulo previsto pelo modelo representa uma categorização discreta ou uma classe.
- Classificação Binária: O rótulo determina se o item pertence a uma classe específica ou não (dois resultados mutuamente exclusivos: Sim/Não, Spam/Não Spam).
- Classificação Multiclasse: O rótulo é previsto a partir de uma das várias classes possíveis (Gato/Cachorro/Pássaro).
O Aprendizado Não Supervisionado envolve o treinamento de modelos usando dados que consistem apenas em Valores de Recursos (Features), sem rótulos conhecidos. O foco é descobrir estruturas, distribuições ou padrões ocultos.
- Clustering (Agrupamento/Clusterização): Identifica semelhanças entre as observações com base em seus recursos e os agrupa em clusters discretos.
- Exemplo: Agrupar flores semelhantes (por tamanho, pétalas, etc.) ou segmentar clientes por comportamento de compra.
Para detalhar a aplicação prática de cada tipo de tarefa, o conteúdo será dividido nos seguintes módulos práticos:
(Referência ao notebook de implementação de um modelo de classificação.)
(Referência ao notebook de implementação de um modelo de agrupamento.)
