Entendiendo la curva ROC y el AUC: Dos medidas del rendimiento de un clasificador binario que van de la mano.

La curva ROC (Receiver Operating Characteristic) se utiliza para evaluar el rendimiento de los algoritmos de clasificación binaria, es decir, entre dos clases o categorías (1 o 0, Verdadero o Falso, etc.). La curva ROC proporciona una representación gráfica, en lugar de un valor único como la mayoría de las otras métricas.

*Esta publicación es una adaptación al español de la publicación Understanding the ROC Curve and AUC original del blog https://towardsdatascience.com/. Agradezco muchísimo al autor su labor al escribirla y al blog el mantenerla publicada, así como el poderla tomar prestada para publicarla aquí. 

Sigue leyendo «Entendiendo la curva ROC y el AUC: Dos medidas del rendimiento de un clasificador binario que van de la mano.»

Métricas de evaluación de rendimiento para predicciones de series temporales

Estarás de acuerdo que una de las habilidades más destacadas en ciencia de datos es la capacidad de predecir series temporales de valores. Predecir el valor futuro de algo contribuye a tomar mejores decisiones. Por lo tanto, es crucial estar seguro de que dicha predicción sea de confianza. La elección, construcción e interpretación de las métricas de evaluación de rendimiento para las predicciones realizadas son tan importantes como hacer las propias predicciones.

*Esta publicación es una adaptación al español de la publicación Forecast evaluation statistics with examples in Python original del blog https://towardsdatascience.com/. Agradezco muchísimo al autor su labor al escribirla y al blog el mantenerla publicada, así como el poderla tomar prestada para publicarla aquí. 

Sigue leyendo «Métricas de evaluación de rendimiento para predicciones de series temporales»

Inteligencia artificial, ¿se avecina una nueva revolución industrial?

¿Qué es la inteligencia artificial? A grandes rasgos podríamos decir que la inteligencia artificial (IA) es la inteligencia llevada a cabo por máquinas, pero con esta definición nos enfrentaríamos a un nuevo reto: definir qué es la inteligencia. Quizás no es una buena idea buscar una definición formal de la IA, pues intuitivamente, el límite que delimita qué es y qué no es ha ido evolucionando a lo largo de los años. Las primeras calculadoras mecánicas (p.ej Pascalina) asombraron al mundo con su capacidad para calcular operaciones aritméticas tal y como lo haría un humano. En cambio, ahora nadie duda que una calculadora científica de uso personal sea una máquina más bien simple, impulsada por un poco de circuitería elemental.

La Pascalina fue la primera calculadora mecánica (1642).

Ahora necesitamos ver un coche circulando sin conductor para sentir que tales maniobras son ejecutadas por un ente artificial e inteligente. Es muy probable que en 20 años veamos los coches autónomos tan simples como vemos ahora las calculadoras. De hecho, ya en la antigua Grecia se construyeron los primeros autómatas, máquinas con forma humana (o animal) que se movían por si solas a través de algún mecanismo.

Sigue leyendo «Inteligencia artificial, ¿se avecina una nueva revolución industrial?»

Visualizaciones interactivas diversas en R

He aquí una nueva entrega de visualizaciones interactivas en R que hará que vuestros resultados hablen por sí solos y reluzcan mucho más. En las dos anteriores entregas mostrábamos gráficos y tablas que, aunque sí se les había añadido una componente interactiva, no dejaban de ser las clásicas visualizaciones que todo el mundo usa.

Clic en la imagen para acceder al Kernel de Kaggle

En esta ocasión mostramos gráficos mucho más rompedores, mucho menos estándar, pero también más específicos que sólo se podrán usar en ocasiones muy determinadas.Hay que decir que la naturaleza de los gráficos mostrados es bastante dispar por eso el matiz de Miscellaneous en el título del Kernel.

Sigue leyendo «Visualizaciones interactivas diversas en R»

Gráficos t-SNE, mapas de calor y dendrogramas interactivos en R

Siguiendo con el campo de la visualización en el mundo del Data Science en esta ocasión os traigo un conjunto adicional de visualizaciones en R más sofisticadas que las del post anterior. 

Clic en la imagen para acceder al Kernel de Kaggle

Todas ellas siguen usando las librerías de Plotly y ggplot2 por lo que conservan todas las bondades interactivas que ya habíamos mencionado en el post anterior.

Sigue leyendo «Gráficos t-SNE, mapas de calor y dendrogramas interactivos en R»

Visualización con DT, Plotly y ggplotly en R

Para aquellos que os gusta la visualización en el mundo del Data Science (como es mi caso), en este post os traigo un conjunto de visualizaciones muy básicas en R pero que cualquier Data Scientist debería conocer y dominar.

Clic en la imagen para acceder al Kernel de Kaggle

Además, veréis que muchas de estas visualizaciones son interactivas, es decir, presentan información adicional a través de un tooltip desplegable o se puede modificar el nivel de zoom entre otras cosas. Esto se consigue a través de la librería de Plotly y la integración de esta con ggplot2.

A parte de visualizaciones con gráficas, también se presenta la librería DT que permite hacer visualizaciones interactivas con tablas. Muy útil para poder explorar tablas como si estuviéramos en el Excel pero sin tener que usarlo.