Probabilidad y Estadística
Horario
Martes 4:00 - 6:00 PM, A201
Jueves 4:00 - 6:00 PM, P202
Libros guía:
- López, A., Rojas-Peña, M. L. & Rojas, A. L. (2022) Herramientas para el Análisis Estadístico de Datos en R. Editorial UPTC.
- Kottegoda, N. T. & Rosso, R. (2008). Applied Statistics for Civil and Environmental Engineers. Blackwell Publishing
Otras referencias:
- Benjamin, J. R. & Cornell, C. A. (2014). Probability, statistics, and decision for civil engineers. Courier Corporation.
- Berthouex, P.M. & Brown, L.C. (2002). Statistics for Environmental Engineers. Lewis Publishers.
- López, A. & Rojas, A. L. (2021) Una Introducción a Python para Estudiantes de Ciencias. Editorial UPTC.
- Shaefer, S.J. & Theodore, L. (2007). Probability and Statitsics Applications for Environmental Science. CRC Press.
Horas de oficina:
Lunes 2:00 - 4:00 PM o por cita.
Lugar: La Colina Casa 2.
Contenidos temáticos mínimos
Unidad 1. Manipulación de bases datos: lectura, filtración de individuos y selección de variables.
Unidad 2. Análisis exploratorio de datos: estadísticas descriptivas, gráficos estadísticos.
Unidad 3. Probabilidad: Axiomas de probabilidad, reglas de probabilidad, probabilidad condicional.
Unidad 4. Variables aleatorias: Definición de variables aleatorias, valores esperados, distribuciones.
Unidad 5. Estimación: puntual e intervalo.
Agenda
Semana | Fecha | Tema |
---|---|---|
1 | 08-20 | Presentación del curso |
08 - 22 | Variables, datos y tipo de estudios [1.1, 1.2] Introducción a Python
[ipynb]
[py].Lectura de datos [1.3.1] | |
2 | 08 - 27 | Lectura de datos, continuación Manipulación de datos [1.3.2] [ipynb] [py] |
08 - 29 | Manipulación de datos, continuación [ipynb] [py] | |
3 | 09 - 03 | Cálculo de estadísticas [1.3.3] [ipynb] [py] |
09 - 05 | ||
4 | 09 - 10 | Gráficas para una variable [2.1.1]
[ipynb] Gráficas para varias variables [2.1.2] [ipynb] |
09 - 12 | Gráficas para varias variables, continuación. Transformaciones [2.2] | |
5 | 09 - 17 | Sesión de preguntas |
09 - 19 | Primer Examen | |
6 | 09 - 24 | Probabilidad [3.1] |
09 - 26 | Probabilidad condicional [3.2] | |
7 | 10 - 01 | Presentaciones |
10 - 03 | Presentaciones | |
8 | 10 - 08 | Presentaciones |
10 - 10 | Presentaciones | |
9 | 10 - 15 | TBA |
10 - 17 | TBA |
Taller 1
Fecha de entrega: Septiembre 18 de 2024, antes de las 2:00pm
Formato de entrega: Documento en formato pdf
de máximo 6 páginas. Debe envíarse por moodle.
Consideramos los datos del artículo: “Optimisation of large wave farms using a multi-strategy evolutionary framework.” escrito por Neshat, Mehdi, Bradley Alexander, Nataliia Y. Sergiienko, and Markus Wagner (2020) En Proceedings of the 2020 Genetic and Evolutionary Computation Conference, pp. 1150-1158.
- Descargue el archivo
large-scale+wave+energy+farm.zip
del siguiente enlace: https://archive.ics.uci.edu/static/public/882/large-scale+wave+energy+farm.zip. - Importe el archivo
WEC_Perth_49.csv
enPython
. Este archivo tiene un total de 149 columnas y 36403 filas. Las primeras 98 columnas correspondes a las coordenadas de localización $(x,y)$ para 49 convertidores de energía de olas. Las primeras dos columnas,X1
yY1
, corresponden al primer convertidor, la tercera y cuarta columnas,X2
yY2
, corresponden al segundo convertidor, y así sucesivamente. Las siguientes 49 columnas corresponden a la potencia generada por cada una de los convertidores. Por ejemplo,Power1
tiene información de la potencía producida por el convertidor No 1. La penúltima columnaqW
es el valor del factor de calidad. La última columna corresponde al total de energía producida por los 49 convertidores. - Conteste las siguientes preguntas para los convertidores asignados según su código:
Convertidores Código
1 y 2: 202320271
3 y 4: 202320864
5 y 6: 202320141
7 y 8: 202320162
9 y 10: 202320263
11 y 12: 202023925
13 y 14: 202320009
15 y 16: 202320210
17 y 18: 202310264
19 y 20: 202127201
21 y 22: 202312630
23 y 24: 202210745
25 y 26: 202320580
27 y 28: 202010606
29 y 30: 202021757
31 y 32: 202220410
33 y 34: 202320131
35 y 36: 202320189
37 y 38: 202310962
39 y 40: 202320321
41 y 42: 202212506
43 y 44: 202320378
45 y 46: 202111916
47 y 48: 202023982
- [15] ¿En qué coordenada se logró el máximo valor de potencía para cada convertidor?
- [10] Para cada convertidor, calcule la mínima y máxima potencia y sus cuartiles.
- [10] Grafique un diagrama de caja para cada uno de los convertidores por separado.
- [20] Grafique un diagrama de caja para cada uno de los convertidores en el mismo gráfico.
- [20] Calcule el porcentaje de la potencia total lograda por sus dos convertidores. Genere una tabla en la que se presenten la media y la desviación estándar para cada valor de
qW
. Note queqW
toma valores $0.72, 0.73,\ldots, 0.88$. - [10] Grafique un diagrama de dispersión del porcentaje calculado en el numeral anterior vs.
qW
. Describa el diagrama obtenido. - [15] Cree un diagrama de dispersión de las coordenadas de localización para sus dos convertidores. Identifique cada convertidor con un color diferente.
NO es necesario incluir su código en el documento
Evaluación
La nota final será obtenida así:
- Primer 50: un examen (30%), dos talleres (30%), presentación (30%) y participación (10%).
- Segundo 50: dos exámenes con un peso del 50%, un taller (30%). El examen con mejor nota valdrá 35% y el otro 15%. Participación (20%).
Conjuntos de datos
Por ejemplo:
- https://www.strongmotioncenter.org/wserv/events/query?minmag=4&maxmag=10&orderby=time&format=csvfile&nodata=404
- https://www.strongmotioncenter.org/wserv/events/query?minmag=4&maxmag=10&orderby=magnitude-asc&format=csvfile&nodata=404
import pandas as pd
base = 'https://www.strongmotioncenter.org/wserv/events/query?minmag='
min = 4
max = 8
ordenar = 'time'
pagina = base + min + '&maxmag=' + max + '&orderby=' + ordenar + '&format=csvfile&nodata=404'
mag4a8 = pd.read_csv(pagina, skiprows=1)
- National Highway Traffic Safety Administration
https://www.nhtsa.gov/file-downloads?p=nhtsa/downloads/FARS/2022/National/