Examen I

Lea la hoja de cálculo Normalized_Data en el archivo minas.xls ubicado en la página https://alexrojas.netlify.app/Data/Prob/minas.xls

Este conjunto de datos fue obtenido por Yilmaz, C., Kahraman, H. T., & Söyler, S. (2018). Para seis diferentes tipos de suelo y diferente clases de minas, se midió, utilizando un sensor fluxgate, el voltaje debido a la distorción magnética a diferentes alturas del suelo. Las columnas en el conjunto de datos son $V$: voltaje, $H$: altura del sensor sobre el suelo, $S$: tipo de suelo y $M$: tipo de mina. Los tipos de minas son: 1: no mina, 2: anti-tanque, 3: anti-personal, 4: “trampa cazabobos” anti-personal , 5: M14 anti-personal. Los tipos de suelos son 0: arenoso seco, 0.2: humus seco, 0.4: con cal seco, 0.6: arenoso húmedo, 0.8: humus húmedo, 1.0: con cal húmedo.

Realice las siguientes manipulciones:

  • [5] Transforme los valores de la columna $S$ para que tome los valores $1, 2, 3, 4, 5, 6$ en lugar de $0, 0.2, 0.4, 0.6, 0.8, 1.0$, respectivamente. Almacenelos en la columna suelo. Cuando termine llame al instructor
  • El siguiente código convierte la variable suelo en una variable categórica. Ejecútelo cambiando m por el nombvre que usted le haya dado al conjunto de datos.
m['suelo'] = m['suelo'].astype("category")
m['suelo'] = m['suelo'].cat.rename_categories({1.0: "Seco-arenoso", 2.0: "Seco-humus", 3.0: "Seco-cal", 4.0:"Húmedo-arenoso", 5.0:"Húmero-humus", 6.0:"Húmedo-cal"})
  • [5] Convierta en variable categórica el tipo de mina (M). Cuando termine llame al instructor

Conteste las siguientes preguntas:

  1. [10] Grafique un diagrama de barras para el tipo de mina. Cuando termine llame al instructor
  2. [15] El coeficiente de variación se una medida de dispersión invariante a la escala de medición y está definido como $$\rm{CV} = \frac{s}{\bar{X}},$$ donde $\bar{X}$ es la media muestral y $s$ es la desviación estándar muestral. Calcule y escriba en la hoja de respuestas el coeficiente de variación de la variable $V$ para cada tipo de mina. ¿Cuál es el tipo de mina con mayor variación en el voltaje detectado con el sensor?
  3. [10] Encuentre el rango intercuartílico de la variable $V$ para cada tipo de suelo.
  4. [10] Elabore un gráfico en el que en el eje $x$ se presente el tipo de suelo y en el eje $y$ la distribución del voltaje. Escriba en su hoja de respuestas los tipos de suelos para los cuales hay observaciones atípicas. Cuando termine llame al instructor
  5. [15] Grafique un diagrama de cajas del voltaje para cada tipo de mina, solo con las mediciones hechas para el tipo de suelo Seco-humus. Con base en este gráfico, ¿para qué tipo de mina el voltaje promedio es más grande que el resto de minas? Cuando termine llame al instructor
  6. [20] A continuación se presenta la Figura 4 del artículo fuente de los datos. Cree esta gráfica donde cada línea conecta el voltaje medio por tipo de mina para los 6 tipos de suelo. Los valores del voltaje en el conjunto de datos han sido modificados; así que, su gráfica será diferente a la presentada acá.
    Figure 4
  7. [10] Repita el numeral anterior, para la Figura 5 del artículo:
    Figure 5

Referencia: Yilmaz, C., Kahraman, H. T., & Söyler, S. (2018). Passive mine detection and classification method based on hybrid model. IEEE Access, 6, 47870-47888. https://ieeexplore.ieee.org/document/8443331/

Alex L Rojas
Alex L Rojas
Associate Professor of Statistics

My main interest is the conservation of Andean forest.