Bibliographic Details
| Title: |
Predicción en carreras de fondo |
| Authors: |
Ruiz Mayo, Daniel |
| Contributors: |
Martínez Muñoz, Gonzalo, Departamento de Ingeniería Informática, Escuela Politécnica Superior |
| Publication Year: |
2016 |
| Collection: |
Universidad Autónoma de Madrid (UAM): Biblos-e Archivo |
| Subject Terms: |
Informática |
| Description: |
Este estudio se ha centrado en predecir los tiempos de finalización de carreras de atletismo de distancia maratón. Esta predicción está basada en los entrenamientos de los corredores durante sus 6 semanas previas a la prueba. En el punto de partida de este trabajo no se disponía de ninguna base de datos ni de entrenamientos ni de carreras, por lo que para lograr el objetivo de este trabajo se ha realizado un análisis de las distintas fuentes de las que extraer la información necesaria, es decir, sus entrenamientos, su marca de maratón y las características de los corredores. La fuente por la que se ha optado después de este análisis es Strava. Una vez elegida la fuente ha sido necesario la automatización de la descarga para conseguir el mayor número de datos posibles. La automatización es importante puesto que cuanto mayor sea el volumen de datos disponibles, mayor es el rendimiento que nos ofrecen los algoritmos de aprendizaje automático. En primer lugar la recopilación de los datos se efectuó de manera semiautomática debido a dificultades para ejecutar el Javascript de las páginas. Finalmente, tras analizar distintas posibles soluciones, la completa automatización del proceso se realizó con diversos crawlers y programas de scrapping como CasperJS. Después de conseguir todos los datos en bruto ha sido necesaria una transformación de los datos disponibles para que los algoritmos de aprendizaje automático pudieran conseguir predicciones válidas. Este procesado de datos se ha realizado mediante programas en Java. Posteriormente se han realizado diversos análisis y filtrados de los datos que nos han permitido mejorar la predicción de las marcas. Estos análisis han consistido en elaborar gráficas mediante scripts en R con los atributos más representativos de los corredores, con las cuales se han extraído conclusiones sobre el bajo número de entrenamientos de algunos corredores o entrenamientos anómalos. Mediante el filtrado de los corredores con información limitada se ha conseguido reducir el error de forma ... |
| Document Type: |
bachelor thesis |
| File Description: |
application/pdf |
| Language: |
Spanish; Castilian |
| Relation: |
https://hdl.handle.net/10486/675353 |
| Availability: |
https://hdl.handle.net/10486/675353 |
| Rights: |
https://creativecommons.org/licenses/by-nc-nd/4.0/ ; Reconocimiento – NoComercial – SinObraDerivada ; open access |
| Accession Number: |
edsbas.B4E60B68 |
| Database: |
BASE |