Visualización de datos categóricos empleando métodos de reducción de dimensionalidad enfocados en datos socioeconómicos

Uloženo v:
Podrobná bibliografie
Název: Visualización de datos categóricos empleando métodos de reducción de dimensionalidad enfocados en datos socioeconómicos
Autoři: Oliveros Duran, Daniel Alejandro
Přispěvatelé: Branch Bedoya, John Willian, Iral Palomino, René
Informace o vydavateli: Universidad Nacional de Colombia, 2025.
Rok vydání: 2025
Témata: Datos Categóricos, Variables (Estadística), Socioeconomic data, Métodos estadísticos, Dimensionality reduction, Análisis estadístico, Situación socioeconómica - Procesamiento de datos, Aplicaciones analíticas, Reducción de dimensionalidad, Embeddings, Sistemas de recolección automática de datos, Visualización, 006 - Métodos especiales de computación [000 - Ciencias de la computación, información y obras generales], Reducción de datos, Análisis multivariante, 519 - Probabilidades y matemáticas aplicadas [510 - Matemáticas], Clasificación socioeconómica, Socioeconomic classification, Categorical data
Popis: Ilustraciones, gráficos En el contexto actual, la disponibilidad creciente de herramientas para el análisis y la visualización estadística ha facilitado significativamente la exploración de datos y sus relaciones. No obstante, el incremento exponencial en la complejidad y el volumen de los datos plantea desafíos considerables, especialmente en el tratamiento de variables categóricas. Estas variables exhiben desafíos particulares en términos de representación gráfica, integración en modelos analíticos y en la interpretación de los resultados. Entre los principales desafíos que se destacan se encuentran la alta cardinalidad, que genera combinaciones complejas y dificulta el análisis individual de cada categoría, así como el incremento de la dimensionalidad derivado de técnicas de codificación como el one-hot encoding. El propósito de este estudio es desarrollar un procedimiento de visualización para datos categóricos con alta cardinalidad y dimensionalidad. Para lograr este objetivo, se propone un enfoque que abarca el procesamiento y la selección de variables categóricas, con el propósito de facilitar la aplicación de técnicas de reducción de dimensionalidad. Posteriormente, se determinará un método de visualización adecuado para representar el conjunto de datos reducido, de manera que sea posible analizar las relaciones entre las variables categóricas en un espacio de menor dimensión. (Tomado de la fuente) In the current context, the increasing availability of tools for statistical analysis and visualization has significantly facilitated the exploration of data and their relationships. However, the exponential increase in the complexity and volume of data poses considerable challenges, especially in the treatment of categorical variables. These variables exhibit particular challenges in terms of graphical representation, integration into analytical models, and interpretation of results. Among the main challenges are high cardinality, which generates complex combinations and makes the individual analysis of each category difficult, as well as increased dimensionality derived from coding techniques such as one-hot encoding. The purpose of this study is to develop a visualization procedure for categorical data with high cardinality and dimensionality. To achieve this objective, an approach is proposed that encompasses the processing and selection of categorical variables, with the purpose of facilitating the application of dimensionality reduction techniques. Subsequently, a suitable visualization method will be determined to represent the reduced data set, so that it will be possible to analyze the relationships between categorical variables in a lower dimensional space. Maestría Ingeniería De Sistemas E Informática.Sede Medellín
Druh dokumentu: Master thesis
Popis souboru: 95 páginas; application/pdf
Jazyk: Spanish; Castilian
DOI: 10.1177/1473871615600010.
DOI: 10.1136/bmj.n71.
DOI: 10.1007/978-3-030-48513-9_31.
DOI: 10.1109/bigd
DOI: 10.1145/2723372.2751520.
DOI: 10.1109/icpr.2010.764.
DOI: 10.1155/2022/6922554.
DOI: 10.1109/icpr48806.2021.9412865.
DOI: 10.1109/tvcg.2015.2467553.
DOI: 10.1007/s10994-018-5728-y.
DOI: 10.1109/icdsaai5
DOI: 10.1016/j.ssmph.2024.101677.
DOI: 10.1098/rsta.2015.0202.
DOI: 10.1016/j.cag.2021.08.009.
DOI: 10.1186/s12859-018-2537-z.
DOI: 10.3390/e23050594.
DOI: 10.1109/tpami.20
DOI: 10.1145/3301294.
DOI: 10.1177/14738716241239018.
DOI: 10.2312/pe.vam
DOI: 10.1109/icas
DOI: 10.1145/25
DOI: 10.1198/106186008x318440.
DOI: 10.3390/app12136799.
DOI: 10.1109/access.2024.3411717.
DOI: 10.1145/3394171.3414445.
DOI: 10.1109/pacificvis52677.2021.00035.
Přístupová URL adresa: https://repositorio.unal.edu.co/handle/unal/88315
Rights: CC BY
Přístupové číslo: edsair.od......1326..c68c8dfe7382b932ac8070486572123e
Databáze: OpenAIRE
Popis
Abstrakt:Ilustraciones, gráficos En el contexto actual, la disponibilidad creciente de herramientas para el análisis y la visualización estadística ha facilitado significativamente la exploración de datos y sus relaciones. No obstante, el incremento exponencial en la complejidad y el volumen de los datos plantea desafíos considerables, especialmente en el tratamiento de variables categóricas. Estas variables exhiben desafíos particulares en términos de representación gráfica, integración en modelos analíticos y en la interpretación de los resultados. Entre los principales desafíos que se destacan se encuentran la alta cardinalidad, que genera combinaciones complejas y dificulta el análisis individual de cada categoría, así como el incremento de la dimensionalidad derivado de técnicas de codificación como el one-hot encoding. El propósito de este estudio es desarrollar un procedimiento de visualización para datos categóricos con alta cardinalidad y dimensionalidad. Para lograr este objetivo, se propone un enfoque que abarca el procesamiento y la selección de variables categóricas, con el propósito de facilitar la aplicación de técnicas de reducción de dimensionalidad. Posteriormente, se determinará un método de visualización adecuado para representar el conjunto de datos reducido, de manera que sea posible analizar las relaciones entre las variables categóricas en un espacio de menor dimensión. (Tomado de la fuente) In the current context, the increasing availability of tools for statistical analysis and visualization has significantly facilitated the exploration of data and their relationships. However, the exponential increase in the complexity and volume of data poses considerable challenges, especially in the treatment of categorical variables. These variables exhibit particular challenges in terms of graphical representation, integration into analytical models, and interpretation of results. Among the main challenges are high cardinality, which generates complex combinations and makes the individual analysis of each category difficult, as well as increased dimensionality derived from coding techniques such as one-hot encoding. The purpose of this study is to develop a visualization procedure for categorical data with high cardinality and dimensionality. To achieve this objective, an approach is proposed that encompasses the processing and selection of categorical variables, with the purpose of facilitating the application of dimensionality reduction techniques. Subsequently, a suitable visualization method will be determined to represent the reduced data set, so that it will be possible to analyze the relationships between categorical variables in a lower dimensional space. Maestría Ingeniería De Sistemas E Informática.Sede Medellín
DOI:10.1177/1473871615600010.