Probabilidad y Estadística

Horario

Martes 4:00 - 6:00 PM, A201
Jueves 4:00 - 6:00 PM, P202

Libros guía:

Otras referencias:

  • Benjamin, J. R. & Cornell, C. A. (2014). Probability, statistics, and decision for civil engineers. Courier Corporation.
  • Berthouex, P.M. & Brown, L.C. (2002). Statistics for Environmental Engineers. Lewis Publishers.
  • López, A. & Rojas, A. L. (2021) Una Introducción a Python para Estudiantes de Ciencias. Editorial UPTC.
  • Shaefer, S.J. & Theodore, L. (2007). Probability and Statitsics Applications for Environmental Science. CRC Press.

Horas de oficina:

Lunes 2:00 - 4:00 PM o por cita.
Lugar: La Colina Casa 2.

Contenidos temáticos mínimos

  • Unidad 1. Manipulación de bases datos: lectura, filtración de individuos y selección de variables.

  • Unidad 2. Análisis exploratorio de datos: estadísticas descriptivas, gráficos estadísticos.

  • Unidad 3. Probabilidad: Axiomas de probabilidad, reglas de probabilidad, probabilidad condicional.

  • Unidad 4. Variables aleatorias: Definición de variables aleatorias, valores esperados, distribuciones.

  • Unidad 5. Estimación: puntual e intervalo.

Agenda

SemanaFechaTema
108-20Presentación del curso
 08 - 22Variables, datos y tipo de estudios [1.1, 1.2]
Introducción a Python [ipynb] [py].
Lectura de datos [1.3.1]
208 - 27Lectura de datos, continuación
Manipulación de datos [1.3.2] [ipynb] [py]
 08 - 29Manipulación de datos, continuación [ipynb] [py]
309 - 03Cálculo de estadísticas [1.3.3] [ipynb] [py]
 09 - 05
409 - 10Gráficas para una variable [2.1.1] [ipynb]
Gráficas para varias variables [2.1.2] [ipynb]
 09 - 12Gráficas para varias variables, continuación.
Transformaciones [2.2]
509 - 17Sesión de preguntas
 09 - 19Primer Examen
609 - 24Probabilidad [3.1]
 09 - 26Probabilidad condicional [3.2]
710 - 01Presentaciones
 10 - 03Presentaciones
810 - 08Presentaciones
 10 - 10Presentaciones
910 - 15TBA
 10 - 17TBA

Taller 1

Fecha de entrega: Septiembre 18 de 2024, antes de las 2:00pm
Formato de entrega: Documento en formato pdf de máximo 6 páginas. Debe envíarse por moodle.

Consideramos los datos del artículo: “Optimisation of large wave farms using a multi-strategy evolutionary framework.” escrito por Neshat, Mehdi, Bradley Alexander, Nataliia Y. Sergiienko, and Markus Wagner (2020) En Proceedings of the 2020 Genetic and Evolutionary Computation Conference, pp. 1150-1158.

  • Descargue el archivo large-scale+wave+energy+farm.zip del siguiente enlace: https://archive.ics.uci.edu/static/public/882/large-scale+wave+energy+farm.zip.
  • Importe el archivo WEC_Perth_49.csv en Python. Este archivo tiene un total de 149 columnas y 36403 filas. Las primeras 98 columnas correspondes a las coordenadas de localización $(x,y)$ para 49 convertidores de energía de olas. Las primeras dos columnas, X1 y Y1, corresponden al primer convertidor, la tercera y cuarta columnas, X2 y Y2, corresponden al segundo convertidor, y así sucesivamente. Las siguientes 49 columnas corresponden a la potencia generada por cada una de los convertidores. Por ejemplo, Power1 tiene información de la potencía producida por el convertidor No 1. La penúltima columna qW es el valor del factor de calidad. La última columna corresponde al total de energía producida por los 49 convertidores.
  • Conteste las siguientes preguntas para los convertidores asignados según su código:

Convertidores Código
1 y 2: 202320271
3 y 4: 202320864
5 y 6: 202320141
7 y 8: 202320162
9 y 10: 202320263
11 y 12: 202023925
13 y 14: 202320009
15 y 16: 202320210
17 y 18: 202310264
19 y 20: 202127201
21 y 22: 202312630
23 y 24: 202210745
25 y 26: 202320580
27 y 28: 202010606
29 y 30: 202021757
31 y 32: 202220410
33 y 34: 202320131
35 y 36: 202320189
37 y 38: 202310962
39 y 40: 202320321
41 y 42: 202212506
43 y 44: 202320378
45 y 46: 202111916
47 y 48: 202023982

  1. [15] ¿En qué coordenada se logró el máximo valor de potencía para cada convertidor?
  2. [10] Para cada convertidor, calcule la mínima y máxima potencia y sus cuartiles.
  3. [10] Grafique un diagrama de caja para cada uno de los convertidores por separado.
  4. [20] Grafique un diagrama de caja para cada uno de los convertidores en el mismo gráfico.
  5. [20] Calcule el porcentaje de la potencia total lograda por sus dos convertidores. Genere una tabla en la que se presenten la media y la desviación estándar para cada valor de qW. Note que qW toma valores $0.72, 0.73,\ldots, 0.88$.
  6. [10] Grafique un diagrama de dispersión del porcentaje calculado en el numeral anterior vs. qW. Describa el diagrama obtenido.
  7. [15] Cree un diagrama de dispersión de las coordenadas de localización para sus dos convertidores. Identifique cada convertidor con un color diferente.

NO es necesario incluir su código en el documento

Evaluación

La nota final será obtenida así:

  • Primer 50: un examen (30%), dos talleres (30%), presentación (30%) y participación (10%).
  • Segundo 50: dos exámenes con un peso del 50%, un taller (30%). El examen con mejor nota valdrá 35% y el otro 15%. Participación (20%).

Conjuntos de datos

Por ejemplo:

import pandas as pd

base = 'https://www.strongmotioncenter.org/wserv/events/query?minmag='
min = 4
max = 8
ordenar = 'time'
pagina = base + min  + '&maxmag=' + max + '&orderby=' + ordenar + '&format=csvfile&nodata=404'
mag4a8 = pd.read_csv(pagina, skiprows=1)
  • National Highway Traffic Safety Administration

https://www.nhtsa.gov/file-downloads?p=nhtsa/downloads/FARS/2022/National/

Alex L Rojas
Alex L Rojas
Associate Professor of Statistics

My main interest is the conservation of Andean forest.

Related