Modelitzar: Moda o Model?
Sergi Massó
Darrerament estan apareixent un munt d’articles científics una part dels quals està dedicada a modelitzar una determinada espècie. Cercant a Google Scholar els articles que continguin les paraules “modelling species” apareixen 1.900.000 resultats (885.000 en els darrers 10 anys).
O si entrem a Web of Science i busquem aquells articles amb el tema “MaxEnt” n’apareixen 1.258 en els darrers 10 anys. I hi trobem treballs per a tots els gustos. Des de treballs teòrics bàsics i molt citats (com el d’Elith et al., 2006) fins a prediccions sobre distribucions en diferents escenaris de canvi climàtic, passant per petits treballs excel·lents però, incomprensiblement, poc coneguts (com és el cas del treball de Lobo (2008) on apunta que millores en les dades de presència poden proporcionar millors resultats que un algoritme complex).
Amb l’objectiu d’oferir una visió general sobre les aplicacions dels models, les seves limitacions i noves maneres de desenvolupar-los, es va realitzar a Tepoztlán, Mèxic, el Taller I3B: Fundamentos, evaluación y futuro de los modelos de distribución de especies, entre els dies 2 i 6 de juny. El taller es va desenvolupar a la Casa Azul de Tepoztlán, en sessions impartides bàsicament per Enrique Martínez Meyer (UNAM), Jorge M. Lobo (Museo Nacional de Ciencias Naturales de Madrid) i Andrés Lira (Kansas University) i en elles es van dur a la pràctica diversos conceptes teòrics i referents a algoritmes, avaluació i transferència de models en l’espai i el temps. Ja a les acaballes del taller, els diferents participants van poder presentar els seus treballs relacionats amb diferents conceptes, però tots ells amb connotacions lligades a la modelització.
En resum i tot fent un paral·lelisme científico-culinari podem dir que elaborar un bon model és com fer una truita. Si volem fer-nos una truita, què hem de fer? Hem d’anar a la nevera (bases de dades) o al mercat (recol·lectar les dades) per obtenir ous (dades). Agafem una paella (algoritme) però no hi tirem encara l’ou. Igual que per a fer una bona truita cal batre bé els ous, per a fer un bon model cal tractar bé les dades. Què passaria si a l’oli calent hi tirem l’ou tal i com surt de la closca? Tindrem una truita? Evidentment, la resposta és que no. De la mateixa manera que per a obtenir el resultat òptim cal tractar els ingredients, per a obtenir un model que s’ajusti al màxim a la realitat cal tractar les dades de manera correcta.
Sergi Massó fent la presentació del concepte ENE (Extremely Narrow Endemic), definit per López-Pujol et al. (2013) i sobre els quals s’obre un ampli ventall de possibilitats de modelització. Foto: I3B
Com a principal conclusió es podria dir que tot, absolutament tot, es pot modelitzar. Però que cal tenir molt clar què es vol modelitzar, quines dades es tenen i com es vol fer. Pel que fa als diferents algoritmes no n’hi ha de millors ni de pitjors, però sempre és recomanable usar-ne més d’un. També es va fer referència a que la moda de modelitzar està portant a publicar treballs poc sòlids, fet que hauríem de reconduir cap a un model de treball enfocat a respondre una pregunta clara i que ens permeti modelitzar amb garanties.
Podeu consultar tots els vídeos i els pdf de les presentacions clicant en aquest enllaç: http://www.recibio.net/taller-modelos-distribucion-especies/?postTabs=2
El taller va concloure amb la redacció, per part de tots els participants, d’un manual de bones pràctiques, disponible també a la web, i reproduït aquí en la seva versió original.
Manual de buenas prácticas
• Hacer modelos es un ejercicio intelectual y no mecánico en el que la pregunta a contestar es clave para decidir el proceso de modelación. • Es necesario consensuar un manual de buenas prácticas amplio y pormenorizado que abarque todos los pasos a realizar en el proceso de modelación. • No estamos modelando puntos en el espacio sino sistemas biológicos con complejas interacciones. • Es necesario tener especial cuidado con los datos de base y su origen, una pequeña muestra puede ser suficiente (3-5%), pero estos datos han de ser representativos ambiental y espacialmente. Los sesgos en la información pueden condicionar completamente el resultado. • Contextualizar la pregunta en el marco teórico de BAM y examinar los datos en el espacio G y E son claves. • Necesitamos herramientas capaces de detectar y paliar el efecto de estos sesgos. • El extent de trabajo (regiones biogeográficas o áreas accesibles) debe estar justificado pues influye grandemente en los resultados. • Las ausencias son necesarias y útiles siempre que se quiera recuperar la distribución real interpolando, o la distribución potencial extrapolando. • Es necesario utilizar información previa para reconocer las variables predictoras relevantes. • El algoritmo de modelización utilizado es lo que menos importa ¿Cuál es la importancia comparada de los tres factores de la ecuación: predictores, variable dependiente y algoritmo?
Agraïments
L’assistència al Taller I3B: Fundamentos, evaluación y futuro de los modelos de distribución de especies ha estat finançada per GBIF España.
Referències
- Elith, J., C. H. Graham, R. P. Anderson, M. Dudík, S. Ferrier, A. Guisan, R. J. Hijmans, F. Huettmann, J. R. Leathwick, A. Lehmann, J. Li, L. G. Lohmann, B. A. Loiselle, G. Manion, C. Moritz, M. Nakamura, Y. Nakazawa, J. M. Overton, A. T. Peterson, S. J. Phillips, K. Richardson, R. Scachetti-Pereira, R. E. Schapire, J. Soberón, S. Williams, M. S. Wisz, and N. E. Zimmermann. 2006. Novel methods improve prediction of species’ distributions from occurrence data. Ecography 29:129-151.
- Lobo, J.M. (2008). More complex distribution models or more representative data? Biodiversity Informatics, 5: 14-19.
- López-Pujol, J., Martinell, M. C., Massó, S., Blanché, C., & Sáez, L. (2013). The ‘paradigm of extremes’: extremely low genetic diversity in an extremely narrow endemic species, Coristospermum huteri (Umbelliferae). Plant Systematics and Evolution, 299(2), 439-446.
|