jueves, 10 de febrero de 2011

PROCESOS BASICOS CON MAXENT


INTRODUCCIÓN


En los procesos de modelación de nichos es importante poder determinar su distribución espacial dentro de un territorio para poder generar iniciativas de conservación de las especies. Para lo cual requerimos de una herramienta indispensable para la elaboración de estos modelos como lo es el algoritmo de Máxima Entropía o MAXENT.

El propósito del siguiente escrito es mostrar los diferentes pasos para la elaboración de un modelo a partir de datos bioclimáticos utilizando el software Maximum Entropy Species Distribution Modeling Version 3.3.3e desarrollado por  ( Steven J. Phillips, Robert P. Anderson, Robert E. Schapire).

A continuación se mostrara los diferentes procesos por los cuales se debe llevar los procesos de modelación por medio de MAXENT, se iniciara por la preparación de la información ya que este utiliza formatos especiales para el cálculo de distribución de especies.

  • PREPARACIÓN ENTRADA DE DATOS:

Iniciaremos con la descarga de los datos necesarios para la elaboración de nuestro modelo de distribución, por medio de la pagina web www.wordclim.org descargaremos las coberturas en formato raster de los factores bioclimáticos.

                                                           (Pagina web www.worldclim.org)

Dentro de la página encontramos diferentes tipos de variables como lo son las temperaturas mínimas, máximas y medianas, también las precipitaciones, altitud y Blioclima, la cual usaremos dentro de nuestro ejercicio.

Descargamos la cobertura de Bioclima 30 arc-seconds (~1 km) en formato para ESRi grid. Como los datos pertenecen a la totalidad del mundo este archivo es bastante pesado 1.8 GB.



Descargado el archivo de Bioclima procederemos a hacer una preparación de estos datos por medio del programa Arcgis 9.3.

Abrimos el programa y despegamos las coberturas en formato raster de Bioclima, al cargar los datos  se puede apreciar que cada corresponde a una escala de valores diferentes, en nuestro caso las capas de Bioclima contiene 19 capas de información. 


                                                    (Capa Raster Bioclima 1 vista general)
Se cargan las capas una por una debido a que la generación de las pirámides se tarda un poco. Luego de cargada procedemos a cortar la zona que necesitamos para realizar el estudio, para esto cargaremos un shape de municipios de Colombia para usarla como mascara y hacer el corte según su forma.
 
(Capa Raster Bioclima + Mascara)

  

  •  PROCEDIMIENTO CORTE DE RASTER EN ARCGIS : 
Para cortar el raster con la forma del shape nos situamos en el ArcToolsBox en la herramienta Spatial Analyst Tools -> Extraction -> Extraction By Mask.

Esto nos despliega una ventana donde ingresamos la capa raster, la máscara y un directorio de salida.
(Corte por Mascara de cobertura Raster)

Procedemos a cortar todas las coberturas raster con el fin de minimizar tamaño de los archivos y su extensión, también minimizara el proceso de modelado dentro del MAXENT.

(Salida del Corte)

Teniendo cortadas las coberturas raster procedemos a hacer una conversión del raster tipo grid a la extensión que utiliza MAXENT que es  .asc el cual es un tipo de archivo de texto ASCII.

Para convertir el raster nos ubicamos en el ArcToolsBox -> Conversion Tools -> Raster to ASCII. Esto nos despliega el asistente para conversión.

  
(Conversión de Raster a ASCII)

Seleccionamos el archivo raster a convertir y seleccionamos  la carpeta donde guardara la salida, en el tipo de extensión seleccionamos .asc en lugar de txt y salvamos -> ok; estos archivos generados se les pierde la proyección por tanto se deben de reproyectar a WGS84 por medio de DataMagnamentTools->Proyections and Transformations->Proyect.

Teniendo cortadas y convertidas las coberturas raster a las extensiones necesarias para utilizarlas en el MAXENT procedemos a preparar los puntos a los cuales se les va a hacer el modelo de distribución, estos se pueden exportar de una capa shape de puntos georreferenciados pues se supone que son la ubicación espacial de las especies dentro del área de estudio.

Para el ejercicio se tomara un shape de puntos distribuidos a lo largo del departamento del valle la cual es nuestra área de estudio. Cargamos los puntos y procedemos a abrir la tabla de atributos con el fin de adicionarle las coordenadas de los mismos en campos nuevos que se llamaran LONGITUD Y LATITUD respectivamente.
  

(Área de estudio y puntos de ubicación de especies)


  • PREPARACIÓN ARCHIVO DE PUNTOS:

Para el cálculo de las coordenadas de cada uno de los puntos debemos tener proyectados nuestros puntos sobre un sistema de coordenadas, las coberturas raster se encuentran sobre el sistema WGS84, por tanto nuestros puntos también deben estarlo luego en la tabla de atributos seleccionamos Options -> addField  y lo nombramos como Longitud, así de la misma manera creamos el campo Latitud. Procedemos a calcular las coordenadas, nos situamos en el campo Longitud y damos click derecho y seleccionamos calcular geometría.

(Calculo de Coordenadas puntos especies)

En el cuadro que se despliega seleccionamos “x” para las longitudes y las “y” para las latitudes. Teniendo las coordenadas dentro de la tabla de atributos del shape de puntos procedemos a exportarlo por medio de Options -> Export ubicado en la tabla de atributos. La tabla generada esta con extensión .dbf este archivo lo abrimos en el Excel y lo modificaremos según las especificaciones que trae el MAXENT en su tutorial.

Ejemplo:
Especies, Long, Lat 

Cabeza Azul Vireo, -89.9, 48.6

BobaAlcaudón, -87.15, 34.95 



Para efectos del presente escrito tomo una especie de orquídea llamada vanillaodorata, las coordenadas no son reales en su ubicación, los puntos fueron generados al azar dentro del modelo de sombras del valle, el cual esta georreferenciado en WGS84.

  
(Archivo plano de coordenadas y especie a calcular distribución)

Los datos se guardan en formato .csv separado por comas como se muestra en la imagen adjunta.

Teniendo los archivos preparados según las especificaciones dentro del MAXET iniciaremos el proceso de cálculo dentro del software Máxima Entropy Especies Distribution  v 3.3.3e.

  • MODELADO CON MAXENT

Descargamos el programa MAXENT de la pagina web http://www.cs.princeton.edu/~schapire/maxent/

Este está compuesto por 3 archivos: maxent.jar, maxent.dos y un archivo readme.txt, para ejecutar el programa seleccionamos el .jar y se despliega la ventana principal del MAXENT.


 
(Entorno grafico de MAXENT 3.3.3e)


En la casilla de la izquierda “samples” ingresamos los datos de los puntos en formato csv con la respectiva especie o taxón. En la casilla de la derecha se ingresan los layer ambientales como el Bioclima que descargamos de la pagina worldclim, estos layer deben ser los que se transformaron a formato ASCII, se selecciona el directorio y se cargan.


Debajo tenemos varias opciones para el despliegue de los datos:

Create responce curve: crea gráfico que muestra cómo predecir la probabilidad relativa de ocurrencia dependiendo de los valores de cada variable ambiental

Make picture of prediction: crea un archivo .png para cada grid de salida

Do jackknife to mesure variable importance: medida de importancia de cada variable del entorno mediante la capacitación a cada variable mediombiental primero se omite, a continuación, utilizar de forma aislada.

Output format:

Lógica: para la salida lógica, las probabilidades son entre (0 o 1), pero a escalas de una manera no lineal con el fin de facilitar su interpretación. Si hay presencias típicas utilizadas durante el entrenamiento son las condiciones ambientales donde la probabilidad de presencia es de alrededor de 0.5, entonces la salida de logística se puede interpretar como la probabilidad predicha de la presencia (de lo contrario se puede interpretar como la idoneidad relativa). Si p (x) es la salida deprimas para las condiciones ambientales x, el valor logísticacorrespondiente cp (x) / (1 + cp (x)) para un determinado valor de c (es decir, la exponencial de la entropía de la distribución deprimas).

Acumulative: Para el formato de salida acumulada, el valor en una celda de la cuadrícula es la suma de las probabilidades de todas las cuadrículas sin probabilidad más alta que la celda de la cuadrícula, por 100. Por ejemplo, la celda de la cuadrícula que se predice que tienen las mejores condiciones para las especies, según el modelo, tendrá un valor acumulado de 100, mientras que los valores acumulados cercanos a 0 indican las predicciones de las condiciones son inadecuadas.

Raw: Para la salida RAW, los valores de salida son las probabilidades (entre 0 y 1) de tal manera que la suma sobre todas las celdas que se utilizan durante el entrenamiento: 1. Los valores típicos son extremadamente pequeños.

Output File Types: el MAXENT utiliza las extensiones .asc, mxe, grd, bil, las cuales son formatos raster de salida de información.

 Output Directory: ubicación del directorio de salida de los resultados del modelamiento.



Projection layer directory/file: Ubicación del directorio con la información de la proyección de los layer medioambientales.


(Preparación para la realización del modelo de máxima entropía)

 

  • SETTINGS


                                                            (Parametros de MAXENT)

Pestaña Basic tiene casillas con opciones basicas de ejecución del modelo, la más importante es el tipo de replica a ejecutar, el programa cuenta con:

Crossvalidate o validación cruzada 

Bootstrap u oreja

Subsample o sub muestra



(Opciones  básicas para el modelamiento)

CROSSVALIDATE: Muestra dividida en pliegues de repeticiones, cada pliegue es usado cada vez por los dato dentro de la prueba.

BOOTSTRAP: Conjunto seleccionado de muestras replicadas por muestreo con remplazo.

SUBSAMPLE: Muestras similares a la configuración elegida, se elimina el porcentaje de pruebas al azar sin remplazo que se utilizara para la revaluación.


                                                  (Parametros avanzados de MAXENT)
 
Pestaña Advanaced o avanzado son opciones avanzadas de configuración para la ejecución del modelo antropico el ítem más importante es el de Apply threshold rules o   aplicación de reglas del umbral.

El cual sirve para  generar una red de salida binaria en la adicción a la red regular de predicción, utilizar el nombre completo de las normas de umbral en la salida HTML Maxent como el argumento lo establece.

Dentro de la casilla se encuentran varias clases de argumento para escoger la regla de umbral según sea nuestra necesidad, por ejemplo el valore fijo acumulado sea igual a 1, 5 o 10.

                                                               (parametros experimentales)
 
Pestaña Experimental es para añadir parámetros según la necesidad del usuario.

Explicados los diferentes componentes dentro del entorno grafico del MXENT podemos dejar por defecto las opciones dentro de los settings y dar click en el botón de Run con el cual se inicia el proceso de modelado, los resultados obtenidos se podrán observar en un archivo html donde se consignara las graficas y los cálculos estadísticos de la probabilidad de la máxima entropía de la especie consultada.


 CONCLUSIONES :


 
Para la elaboración de modelos con el algoritmo de máxima entropía se debe tener claro los conceptos de probabilidad estadística de una distribución espacial con el fin de poder escoger correctamente las características necesarias para la generación del modelo. La explicación del algoritmo esta explicado en la ayuda dentro del programa.



Es necesario realizar la preparación de los datos de entrada para que el programa funciones correctamente y genere la información correcta.


 

10 comentarios:

  1. Muchas gracias por el tutorial la verdad era lo que estaba buscando pues no hay ni videos tutoriales en youtube para el uso de maxent. Pero te agradecería que pudieras subir algun video tutorial que es mas práctico. Saludos

    ResponderEliminar
  2. Hola, quisiera hacerte una consulta,
    estoy haciendo el procedimiento anterior,
    voy a incluir una capa de cobertura vegetal
    Corine, pero no he podido colocar el tamaño
    de la Celda al rasterizar, el tamaño que quiero
    colocar es : 0,0083, que es el tamaño de celdas
    de las capas de Bioclim.
    Te agradezco si me puedes ayudar, estoy usando
    ArcGIS para rasterizar.

    ResponderEliminar
  3. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  4. Hola. No logro que MaxEnt cargue las capas con la info bioclimática, si bien éstas tienen formato ASC. ¿Qué puede generar este problema y cómo corregirlo?. En los tutoriales no se especifican muy bien las características de los archivos más allá del formato requerido. No sé qué hacer y me urge avanzar con la aplicación de este software. Muchas gracias.....Ayudaaaa!......

    ResponderEliminar
  5. Hola, me podrias facilitar el instalador de este programa, te lo agradecere mucho. saludos.

    ResponderEliminar
  6. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  7. ola, gostaria sabe qual a finalidade da Função de "replica" na aba básica

    ResponderEliminar