Introdução ao aprendizado de máquina
- 24-07-2022
- chuong xuan
- 0 Comments
Mục lục
Por que aprender Machine Learning?
- Planilhas (Excel, CSV): Como local para armazenar os dados de negócios necessários, é uma das ferramentas mais úteis disponíveis atualmente. Ajuda-nos a analisar e representar os dados que uma empresa precisa.
- Banco de dados relacional (MySQL): É um local de armazenamento de dados melhor do que planilhas e é executado por meio de instruções de consulta, a partir das quais as empresas podem usar instruções para pesquisar e processar dados.
- Big Data (NoSQL): FB, Amazon, Shopee, … devido ao grande volume de dados do usuário, é chamado de big data e aqui os dados não são estritamente organizados, por isso é necessário usar aprendizado de máquina em vez de filhos.
Diversas áreas estão relacionadas ao aprendizado de máquina.
Inteligência Artificial IA?
A inteligência artificial ou inteligência artificial (IA) é um ramo da ciência da computação. Uma inteligência criada por humanos com o objetivo de ajudar os computadores a automatizar comportamentos inteligentes como os humanos.
Aprendizado de máquina
Como um sub-ramo da IA, o aprendizado de máquina usa algoritmos ( algoritmos ) ou programas de computador para aprender dados diferentes e, em seguida, usa o algoritmo e o que aprendeu anteriormente para fazer uma previsão, adivinhar ou reclassificar com base em dados semelhantes.
Exemplo: Categorização ou análise de produto.
Diferença entre Aprendizado de Máquina e Algoritmos Normais
- Algoritmo Normal: use entrada + algoritmo -> resultado (saída).
- Algoritmo de Máquina: Comece com entrada e saída -> a partir daí determine a relação entre I/P e O/P.
Alguns problemas no aprendizado de máquina
Supervisionado: dados contendo rótulos
por exemplo: Como dados de cães e gatos,…
Não supervisionado: dados não rotulados como um arquivo do Excel sem cabeçalhos de coluna.
- Clustering: Ajuda-nos a agrupar grupos. ex.: Agrupar clientes de acordo com as preferências do cliente.
- Aprendizagem de regras de associação: associando vários atributos para prever o comportamento do cliente. por exemplo, o que comprar no futuro.
Reforço: Ensine a Máquina a tentar e falhar para que haja recompensas para melhorar na próxima vez. ex: aplicado em alpha go – máquina de xadrez mundialmente famosa.
Aprendizado Profundo
Deep Learning é um subconjunto do Machine Learning, capaz de ser diferente em alguns aspectos importantes do Machine Learning raso tradicional, permitindo que os computadores resolvam uma ampla gama de problemas complexos insolúveis.
Ciência de dados
Análise de dados: Analise os dados de lá para fazer os relatórios necessários.
Data Science: execute testes em conjuntos de dados para descobrir informações úteis sobre esses dados.
Como funciona o aprendizado de máquina
Etapa 1 : Identifique o problema – converta a frase do cliente para o problema de aprendizado de máquina.
Você deve determinar o que seu problema precisa ser resolvido?
- Supervisionado
- Sem supervisão
- Classificação
- Regressão
Etapa 2 : Dados: Qual é o tipo de dados existente?
Etapa 3 : Avaliação
- Determine quando o algoritmo está correto.
- Indicadores que precisam de atenção nos ajudam a avaliar o projeto.
Etapa 4: recursos de dados (recursos)
- Quais recursos seus dados têm e quais recursos você precisa usar para construir o modelo? A partir daí, transforme os recursos em padrões.
- Existem 3 tipos principais de recursos:
- Características categóricas: podem ser de gênero ou sim/não.
- Recursos contínuos (ou numéricos): um valor numérico, como o intervalo da mensagem ou o número de vezes que uma ação é executada.
- Recursos derivados (o tipo de recursos que você cria a partir de dados): geralmente chamados de engenharia de recursos. Por exemplo, ao obter velocidade e tempo de seus dados iniciais, você pode criar um recurso Derivado que é a distância percorrida.
Etapa 5 : Modelos
Nos dias de hoje, existem muitas bibliotecas para ajudá-lo a resolver problemas, é importante determinar quando usar qual modelo?
- Aprendizado Supervisionado: (Entrada e Saída) Dados + Rótulo → Classificações, Modelo de Regressões,…
- Aprendizado não supervisionado: somente entrada) Dados → Clustering,…
- Aprendizado de reforço: completando e recompensando: deve encontrar uma maneira de atualizar as pontuações de ML.
Passo 6 : Teste, avalie.
Revise o modelo e use métodos de avaliação algorítmica para ver se seu modelo está correto e quão preciso ele é?
Classificação | Regressão | Recomendação |
---|---|---|
Precisão | Erro Médio Absoluto (MAE) | Precisão em KY |
Precisão | Erro quadrático médio (MSE) | |
Lembrar | Erro quadrático médio (RMSE) |
Alguns problemas comuns no processamento de aprendizado de máquina.
Sobreajuste
Quando o conjunto de dados de treinamento é bom e os dados de teste são bons, seu modelo geral não é bom.
Solução : Tente usar um modelo mais simples e certifique-se de que seus dados de teste sejam do mesmo tipo que os dados de treinamento.
Subajuste
O desempenho dos dados de treinamento é ruim, então seus dados não foram aprendidos corretamente em primeiro lugar. Leva ao underfitting.
Solução: tente dividir o treinamento de dados e o teste de dados novamente e tente ajustar os parâmetros dos dados.