

Una definición de ML es la siguiente:

El machine learning es un método de análisis de datos que automatiza la construcción de modelos analíticos. Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos, identificar patrones y tomar decisiones con mínima intervención humana.


Simplificando bastante esta definición, el ML es un conjunto de algoritmos diseñados para resolver problemas con el uso de datos. Estos problemas se pueden clasificar en tres grandes grupos:

  • Aprendizaje supervisado. Un modelo se ajusta conociendo las entradas y las salidas asociadas. El objetivo es hacer predicciones en presencia de incertidumbre. Este tipo de aprendizaje se puede dividir en:

    • Clasificación. Predecir respuestas discretas.

    • Regresión. Predecir respuestas continuas.

  • Aprendizaje no supervisado. Encuentra patrones intrínsecos en datos de entrada que no estan asociados a ninguna salida. Este tipo de aprendizaje se puede dividir en

    • Agrupación. Agrupar los datos de acuerdo a sus características intrínsecas.

    • Reducción de dimensiones. Reducir el número de características de los datos bajo algún criterio.

Otros algoritmos de aprendizaje. Destacan los algoritmos de Reinformcement Learning. Este tipo de algoritmos determinan qué acciones debe escoger un agente de software en un entorno dado con el fin de maximizar alguna noción de “recompensa” o premio acumulado.


Para leer

Machine learning y big data: ¿qué oportunidades ofrecen estas disciplinas para la evaluación de impacto?

Extra: Melissa Dell


La forma de insertar ténicas de una área a otra parece subjetiva, es decir, decidir si un algoritmo es propio del ML tiene que ver con la secuencia de cómo se aprendan éstos. Por ejemplo, en el libro The Elements of Statistical Learning Data Mining, Inference, and Prediction (ESoSL), que es considerado un referente para aprender ML, en el capítulo 3: Linear Methods for Regression, se aborda el problema de mínimos cuadrados ordinarios (MCO) de forma similar a como se puede encontrar en libros clásicos de econometría.

Un enunciado simplista para sintetizar el uso de estos métodos en EI, pero que da una perspectiva del objetivo de esta sección, es el siguiente

Para utilizar ML en Economía es necesario describir el problema de Economía como un problema matemático cuya solución pueda implementarse como un algoritmo de ML. Lo cuál no es necesariamente fácil de construir (my feeling)


scikit-learn. Herramientas simples y eficientes para el análisis de datos, construido sobre Numpy, Scipy y Matplotlib (no es robusto para redes neuronales, para redes neuronales, se puede consultar PyTorch, TensorFlow)


conda install -c intel scikit-learn

En la guía de usuario, hay un resumen del problema a resolver, y enlaces a problemas de ejemplo. En el siguiente enlace está la documentación por función

Cargar datos de prueba y datos adquiridos (toy datasets, real datasets).

Para mayor información enlace

Los siguentes códigos son los ejemplos desarrollados en la guía de referencia correspondiente

from sklearn.datasets import load_iris #(para datos de prueba)
data = load_iris()
from sklearn.datasets import fetch_california_housing # datos reales

data1 = fetch_california_housing()
data2 = fetch_california_housing(return_X_y=True)
X,y = fetch_california_housing(return_X_y=True)
Conjunto de entrenamiento y conjunto de prueba

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=42)