Preprocesado de Datos
(Curso Académico 2022 - 2023)
Mostrar Todo


Nota informativa: Atendiendo a la normativa de Protección de Datos y propiedad intelectual en la que se limita la publicación de imágenes de terceras personas sin su consentimiento, aquellos que difundan grabaciones de las sesiones de clase sin previo consentimiento de las personas implicadas, serán responsables ante la ley del uso prohibido de las citadas grabaciones.



1. Datos descriptivos de la asignatura
  • Código: 835870904
  • Centro: Escuela de Doctorado y Estudios de Postgrado
  • Lugar de impartición: -
  • Titulación: Máster Universitario en Ciberseguridad e Inteligencia de Datos
  • Plan de Estudios: 2018 (publicado en 19-09-2018)
  • Rama de conocimiento: Ingeniería y Arquitectura
  • Itinerario/Intensificación:
  • Departamento/s:
  • Área/s de conocimiento:
    • Estadística e Investigación Operativa
  • Curso: 1
  • Carácter:
  • Duración: Primer cuatrimestre
  • Créditos ECTS: 3,0
  • Modalidad de impartición: Semipresencial
  • Horario: Ver horario
  • Dirección web de la asignatura: Ver web de la asignatura
  • Idioma: Castellano e Inglés (0,15 ECTS en Inglés)
2. Requisitos para cursar la asignatura
3. Profesorado que imparte la asignatura

Profesor/a Coordinador/a: CARLOS PEREZ GONZALEZ

General:
Nombre:
CARLOS
Apellido:
PEREZ GONZALEZ
Departamento:
Matemáticas, Estadística e Investigación Operativa
Área de conocimiento:
Estadística e Investigación Operativa
Grupo:
Contacto:
Teléfono 1:
922318094
Teléfono 2:
Correo electrónico:
cpgonzal@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 16:00 19:00 Torre Profesor Agustín Arévalo - CE.1B Despacho del profesor en la segunda planta de la torre.
Todo el cuatrimestre Jueves 16:00 19:00 Torre Profesor Agustín Arévalo - CE.1B Despacho del profesor en la segunda planta de la torre.
Observaciones: Las tutorías podrán variar dependiendo de la coincidencia con otras actividades académicas. El horario de tutorías se mantendrá actualizado en el aula virtual de la asignatura y los cambios en el mismo serán notificados a través de dicho medio.
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 16:00 19:00 Torre Profesor Agustín Arévalo - CE.1B Despacho del profesor en la segunda planta de la torre.
Todo el cuatrimestre Jueves 16:00 19:00 Torre Profesor Agustín Arévalo - CE.1B Despacho del profesor en la segunda planta de la torre.
Observaciones: Las tutorías podrán variar dependiendo de la coincidencia con otras actividades académicas. El horario de tutorías se mantendrá actualizado en el aula virtual de la asignatura y los cambios en el mismo serán notificados a través de dicho medio.
General:
Nombre:
ARTURO JAVIER
Apellido:
FERNANDEZ RODRIGUEZ
Departamento:
Matemáticas, Estadística e Investigación Operativa
Área de conocimiento:
Estadística e Investigación Operativa
Grupo:
Contacto:
Teléfono 1:
922 318179
Teléfono 2:
Correo electrónico:
ajfernan@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 11:00 14:00 Edificio de Física y Matemáticas - AN.2B 88
Todo el cuatrimestre Miércoles 11:00 14:00 Edificio de Física y Matemáticas - AN.2B 88
Observaciones: El lugar y horario de tutorías pueden sufrir modificaciones puntuales que serán debidamente comunicadas en tiempo y forma.
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Miércoles 13:00 15:00 Edificio de Física y Matemáticas - AN.2B 88
Todo el cuatrimestre Jueves 10:30 14:30 Edificio de Física y Matemáticas - AN.2B 88
Observaciones: El lugar y horario de tutorías pueden sufrir modificaciones puntuales que serán debidamente comunicadas en tiempo y forma.
4. Contextualización de la asignatura en el plan de estudio
  • Bloque formativo al que pertenece la asignatura:
  • Perfil profesional:
5. Competencias

Generales

  • CG1 - Ser capaces de aplicar los conocimientos adquiridos para resolver problemas en entornos nuevos o poco conocidos dentro de contextos relacionados con seguridad informática o inteligencia de datos
  • CG3 - Mantener una actitud de permanente actualización, que les permita estudiar de manera autónoma mediante formación continua en su futuro desempeño profesional como expertos en seguridad informática e inteligencia de datos
  • CG7 - Desarrollar las capacidades de trabajo en equipo y las habilidades de comunicación para mantener relaciones con otros profesionales y con organizaciones relevantes
  • CG8 - Tener la capacidad analítica y de resolución para atender a los problemas reales de acuerdo con los valores éticos y sociales y con el máximo respeto a la legalidad vigente

Básicas

  • CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
  • CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
  • CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo

Específicas

  • CE12 - Conocer los métodos y procedimientos par la preparación de conjuntos de datos para aplicar técnicas de análisis de forma adecuada
6. Contenidos de la asignatura

Contenidos teóricos y prácticos de la asignatura

  1. Preparación de datos (limpieza, transformación, normalización, imputación).
  2. Reducción de datos (selección de características, selección de instancias, discretización, análisis de componentes principales ...)
  3. Librerías y lenguajes de procesamiento de datos
    • Lenguaje R + Rstudio
    • Lenguaje Python+Jupyter

Actividades a desarrollar en otro idioma

En esta asignatura se impartirán 1,5 horas de clases en inglés.
En general, se trabajará preferentemente con bibliografía en inglés y el alumnado deberá ser capaz de extraer la información necesaria para seguir la asignatura a partir de dicha documentación, junto con los apuntes del profesorado.
Asimismo, el software utilizado en prácticas y los manuales de uso y ayuda estarán en dicho idioma.
7. Metodología y volumen de trabajo del estudiante

Descripción

La metodología docente de las clases teóricas consistirá en sesiones en las que el profesorado explicará los conceptos fundamentales de cada tema que deben ser asimilados por el alumnado, bien presencialmente, o no
presencialmente mediante retransmisión online, en directo usando videoconferencia o en diferido a través de grabaciones colgadas en el entorno virtual.
La metodología docente de las clases prácticas consistirá en sesiones supervisadas en grupos reducidos en el laboratorio en las que se realizarán diversas prácticas informáticas de dificultad creciente aplicando los conceptos expuestos en las clases de teoría. Además, el alumnado aprenderá a usar diversas herramientas, en entornos reales o de simulación, así como metodologías relacionadas con el contexto de la materia.
La metodología docente de los informes consistirá en el desarrollo por parte del alumnado de su capacidad para la aplicación de los conocimientos adquiridos y la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios y multidisciplinares, siendo capaces de integrar estos conocimientos.
Se plantea una metodología docente para los seminarios que consistirá en sesiones donde se llevará a cabo una explicación más detallada de determinados aspectos concretos de algunos temas teóricos o prácticos especialmente relevantes. Se ofrecerán seminarios donde profesionales de esta materia harán charlas debates con el alumnado de los temas relacionados con el mundo profesional.
Las tutorías individuales ayudarán a reforzar los diferentes aspectos de la materia y ayudarán al alumnado en la comprensión de la teoría y la realización de las prácticas.

Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante

Actividades formativas Horas presenciales Horas de trabajo autónomo Total horas Relación con competencias
Clases teóricas 5,00 5,00 10,0 [CB10], [CB8], [CG1]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio) 8,00 8,00 16,0 [CE12], [CB10], [CB8], [CG8], [CG1]
Realización de seminarios u otras actividades complementarias 1,00 1,00 2,0 [CB10], [CG3]
Estudio/preparación de clases teóricas 0,00 10,00 10,0 [CB10], [CB7], [CG3]
Estudio/preparación de clases prácticas 0,00 6,00 6,0 [CE12], [CB10], [CB7], [CG3]
Realización de exámenes 1,00 0,00 1,0 [CE12], [CB7], [CG1]
Asistencia a tutorías 0,00 6,00 6,0 [CB10], [CB7]
Informes, trabajos y proyectos 0,00 24,00 24,0 [CE12], [CB8], [CB7], [CG8], [CG7], [CG1]
Total horas
Total ECTS
8. Bibliografía / Recursos

Bibliografía básica

Salvador García, Julián Luengo, Francisco Herrera - Data Preprocessing in Data Mining [BBTK]
Mark Lutz, David Ascher - Learning Python [BBTK]
Edwin de Jonge, Mark van der Loo - An introduction to data cleaning with R [Rproject]
Hadley Wickham and Garrett Grolemund - R for data science : Import, tidy, transform, visualize, and model data [BBTK]

Bibliografía complementaria

Otros recursos

9. Sistema de evaluación y calificación

Descripción

La evaluación de la asignatura se regirá por el Reglamento de Evaluación y Calificación de la Universidad de La Laguna (BOC de 19 de enero de 2016), o el que la Universidad tenga vigente, además de por lo establecido en la Memoria de Verificación inicial o posteriores modificaciones

Modalidad de evaluación continua:
La evaluación continua de la asignatura se aplicará en las convocatorias ordinarias del curso y se llevará a cabo mediante la realización de un conjunto de actividades individuales y una prueba final. Las actividades individuales que los alumnos tendrán que llevar a cabo consistirán en la realización de cuestionarios, ejercicios y tareas entregables así como informes de prácticas. Los ejercicios serán calificados de 0-10 y
se aplicarán las siguientes ponderaciones en el cálculo de la nota por evaluación continua:
A: Prueba final (presentación de un proyecto sobre un supuesto práctico): 50% de la calificación final.
B: Cuestionarios de preguntas cortas: 15% de la calificación final. 
C: Informes de prácticas, tareas y ejercicios: 35% de la calificación final. 
La calificación final de la asignatura se calculará a partir de los pesos anteriores. Se deberá obtener una nota no inferior a 5 para superar la asignatura. La calificación obtenida en las actividades de los apartados B-C será válida para todas las convocatorias del curso académico. Dicha calificación será válida para todas las convocatorias del curso académico. Se considera que la convocatoria queda agotada una vez que el alumno se presente, al menos, a un 50% de las actividades de evaluación continua, salvo en los casos recogidos en el reglamento de evaluación.

Modalidad de evaluación única:
Los alumnos que deseen optar por la modalidad de evaluación única deberán comunicarlo al profesor coordinador de la asignatura a través del procedimiento habilitado en el aula virtual de la misma en el plazo de un mes a partir del inicio del cuatrimestre. Solo por circunstancias sobrevenidas, y que se recogen en el reglamento de evaluación, se admitirán solicitudes transcurrido el primer mes de docencia. En esta modalidad de evaluación el alumno deberá realizar las siguientes pruebas:
D: Prueba final escrita (examen): 50% de la calificación final. 
E: Cuestionarios de preguntas cortas: 15% de la calificación final. 
F: Examen de prácticas basado en la resolución de un supuesto práctico: 35% de la calificación final.
La realización de estas pruebas tendrá lugar en las fechas oficiales de las convocatorias del curso y la calificación se calculará a partir de estos pesos, debiendo obtener una nota no inferior a 5 para superar la asignatura. La realización de estas pruebas será también la que se lleve a cabo en las convocatorias extraordinarias.


 

Estrategia Evaluativa

Tipo de prueba Competencias Criterios Ponderación
Pruebas de respuesta corta [CB10], [CB8], [CB7], [CG1] - Nivel de conocimientos adquiridos y nivel de comprensión alcanzado en la aplicación de los contenidos explicados.
- Adecuación a lo solicitado.
15,00 %
Trabajos y proyectos [CE12], [CB10], [CB8], [CB7], [CG7], [CG3], [CG1] - Calidad del trabajo desarrollado y concreción en la redacción
- Interés demostrado
- Adecuación a lo solicitado.
50,00 %
Informes memorias de prácticas [CB10], [CB8], [CB7], [CG8], [CG3], [CG1] - Nivel de comprensión alcanzado en la aplicación de los contenidos explicados así como la destreza técnica desarrollada durante las prácticas.
- Adecuación a lo solicitado.
35,00 %
10. Resultados de Aprendizaje
El alumnado debe ser capaz de identificar qué técnica de preparación de datos o reducción de la dimensionalidad aplicar para adaptar los datos a los algoritmos de análisis, aumentar la eficiencia y precisión de los mismos o mejorar la comprensión del modelo obtenido.
11. Cronograma / calendario de la asignatura

Descripción

Debido al carácter semipresencial del máster, está previsto que las clases presenciales se desarrollen de la forma siguiente:
El alumnado tendrá 3 horas diarias las semanas 1 a 5 del primer cuatrimestre.
Todas las asignaturas se desarrollarán en bimestres, y concretamente esta asignatura se impartirá en el bimestre 1. El siguiente cronograma recoge la distribución de actividades a modo orientativo. Se utilizará el aula virtual para informar del calendario de la asignatura y la distribución de las diferentes actividades presenciales programadas en la misma.

Primer cuatrimestre

Semana Temas Actividades de enseñanza aprendizaje Horas de trabajo presencial Horas de trabajo autónomo Total
Semana 1: Tema 1 Clases teóricas y prácticas 2.00 0.00 2.00
Semana 2: Tema 2 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 3: Tema 3 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 4: Tema 4 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 5: Tema 5 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 6: Temas 1 hasta 3 Actividades semipresenciales en el aula
virtual. Realización de cuestionarios on-line.
Videotutoriales y foro para la resolución de
dudas.
0.00 10.00 10.00
Semana 7: Tema 4 Actividades semipresenciales en el aula
virtual. Realización de cuestionarios on-line.
Videotutoriales y foro para la resolución de
dudas.
0.00 10.00 10.00
Semana 8: Tema 5 Actividades semipresenciales en el aula
virtual. Realización de cuestionarios on-line.
Videotutoriales y foro para la resolución de
dudas.
0.00 10.00 10.00
Semana 9: 0.00 0.00 0.00
Semana 10: 0.00 0.00 0.00
Semana 11: 0.00 0.00 0.00
Semana 12: 0.00 0.00 0.00
Semana 13: 0.00 0.00 0.00
Semana 14: 0.00 0.00 0.00
Semana 15: (Semanas 15 a 16) Presentación de proyectos y evaluación Evaluación del alumnado 1.00 2.00 3.00
Semana 16 a 18: 0.00 0.00 0.00
Total 15.00 60.00 75.00
Fecha de última modificación: 01-07-2022
Fecha de aprobación: 11-07-2022