Archivo de autor

Expert Data Scientist at @synergicpartner | PhD in Robotics/Machine Learning. Follow me on Github (smorante)

17
sep
Precauciones a la hora de normalizar datos en Data Science
  • Santiago Morante
  • 4075 Views
  • 13 Comments
  • Algorithms . Algoritmos . Analítica Avanzada . Big Data . Blog Synergic . Data . Data Normalization . Data Science . datos . Machine Learning . Normalización de Datos .

Para que funcionen mejor muchos algoritmos de Machine Learning usados en Data Science, hay que normalizar las variables de entrada al algoritmo. Normalizar significa, en este caso, comprimir o extender los valores de la variable para que estén en un rango definido. Sin embargo, una mala aplicación de la normalización, o una elección descuidada del método de normalización puede arruinar tus datos, y con ello tu análisis. Vamos a ver unos ejemplos de los métodos de normalización más usados actualmente. Escalado de variables (Feature Scaling o MinMax Scaler) En este caso, cada entrada se normaliza entre unos límites definidos: El problema de este tipo de normalization, es que comprime los datos de entrada entre unos límites empíricos (el máximo y…

Clientes destacados