LAB-002 Documentado

Big Data y Machine Learning — Clasificación, clustering y análisis de datos

Colección de proyectos de ML desarrollados en formación académica: detección de fake news con TF-IDF y ensamble (99% accuracy), clasificador de canciones de Spotify comparando 6 algoritmos con GridSearch (Random Forest, 76%), clustering de zonas por criminalidad con K-Means y método del codo, y análisis exploratorio de ventas con Plotly. Foco en metodología: comparación de modelos, ajuste de hiperparámetros y lectura crítica de resultados.

Python

scikit-learn

pandas

NumPy

Matplotlib

Seaborn

Plotly

Jupyter

Aprendizaje

Reforcé el ciclo completo de un proyecto de ML supervisado y no supervisado, desde la exploración del dataset hasta la evaluación con validación cruzada y curvas de aprendizaje. Sobre todo, entendí la importancia de la lectura crítica: cuestionar un accuracy sospechosamente alto en vez de celebrarlo, y reconocer cuándo los datos no sostienen una hipótesis. Es la base sobre la que apoyo mi próximo paso hacia ciencia de datos e IA.