1.9 KiB
title | localeTitle |
---|---|
Data Alone Is not Enough | Dados sozinhos não são suficientes |
Dados sozinhos não são suficientes
Sem contabilizar os algoritmos de aprendizado de máquina em mudança ou outros aspectos Ao treinar o modelo, os dados por si só não são suficientes para ajudar o aluno a se sair melhor.
Cada aluno deve incorporar alguns conhecimentos ou suposições além dos dados que é dado para generalizar além dele (Domingos, 2012).
O que esta afirmação está essencialmente dizendo é que se você escolher cegamente aprendiz só porque você ouviu que faz bem, coletando mais dados não necessariamente ajudá-lo em seus objetivos de aprendizado de máquina.
Por exemplo, digamos que você tenha dados que dependem do tempo (por exemplo, dados da série temporal) e você quer usar um classificador binário (por exemplo, regressão logística). Coletando mais dados de séries temporais podem não ser os melhores para ajudar seu aluno. Isto é porque um classificador binário não é projetado para séries temporais.
Isso não quer dizer que uma vez que você tenha escolhido o melhor algoritmo de aprendizado de máquina com base no seu problema que adicionar mais dados não é bom. Neste caso, Ajudará você.
O aprendizado de máquina não é mágico; não pode conseguir algo do nada. O que faz é obter mais de menos ... Alunos combinam conhecimento com dados para crescer programas (Domingos, 2012).