Uso de redes neuronales convolucionales para contar las entradas a nidos de loros en fotografías de la colonia más grande conocida de psitaciformes. Articulo de Investigacion
Abstracto
El conteo de poblaciones animales es fundamental para comprender los procesos ecológicos. Los conteos permiten estimar el tamaño de una población animal en puntos específicos del tiempo, lo cual es información esencial para comprender el cambio demográfico. Sin embargo, en el caso de poblaciones grandes, los conteos consumen mucho tiempo, en particular si se realizan manualmente. Aquí, aprovechamos las redes neuronales convolucionales (CNN) para contar el número total de entradas de nidos en 222 fotografías que cubren la colonia de Psittaciformes (Aves) más grande conocida en el mundo. Realizamos nuestro estudio en la colonia más grande de loros barranqueros Cyanoliseus patagonus , ubicada en un acantilado frente al océano Atlántico en las cercanías de la aldea El Cóndor, en el noreste de la Patagonia, Argentina. También nos propusimos investigar la distribución de las entradas de nidos a lo largo del acantilado donde se encuentra la colonia. Para esto, utilizamos tres arquitecturas CNN, U-Net, ResUnet y DeepLabv3. La arquitectura U-Net mostró el mejor desempeño, contando una media de 59.842 entradas de nidos de loros barranqueros en toda la colonia, con un error absoluto medio de 2,7 entradas de nidos en las áreas de prueba, medido como la diferencia entre los recuentos reales y previstos por área. En comparación con un estudio previo realizado en la colonia El Cóndor hace más de 20 años, las arquitecturas CNN también detectaron diferencias notables en la distribución de las entradas de nidos a lo largo del acantilado. Mostramos que los fuertes cambios observados en la distribución de las entradas de nidos son un efecto medible de un largo historial de perturbaciones inducidas por el hombre en la colonia de loros barranqueros en El Cóndor. Dada la importancia primordial de la colonia de loros barranqueros en El Cóndor, que concentra el 71% de la población mundial de esta especie, defendemos que es imperativo reducir tal grado de perturbación antes de que los loros alcancen el límite de su capacidad de adaptación.
1 INTRODUCCIÓN
La cuantificación de las poblaciones animales proporciona información fundamental para comprender los procesos y mecanismos ecológicos y evolutivos (Liu et al., 2020 ; Robinson et al., 2022 ; Volkov et al., 2003 ). También es un requisito básico para determinar la frecuencia relativa de una especie dentro de una comunidad, su tendencia poblacional y su estado de conservación (Eikelboom et al., 2019 ; Keeping & Pelletier, 2014 ; Volkov et al., 2003 ). Conocer la abundancia de una especie a lo largo del tiempo ayudará a comprender los cambios en la mortalidad natural, los efectos del cambio ambiental en la supervivencia, el impacto del grado actual de cambio ambiental antropogénico, identificar amenazas y facilitar medidas de conservación efectivas (Brlík et al., 2021 ; Dénes et al., 2015 ; Kellenberger et al., 2021 ; Ripple et al., 2022 ).
Numerosas especies animales, incluidas muchas aves, se reproducen en grandes colonias (Ainley et al., 2003 ; Liu et al., 2020 ; Masello et al., 2006 ). Se han utilizado varias técnicas para estimar el tamaño de sus poblaciones, incluidos estudios terrestres, recuentos a partir de fotografías e imágenes satelitales y el uso de cámaras trampa y vehículos aéreos desocupados (Bibby et al., 1993 ; Boersma, 1998 ; Dickens et al., 2021 ; Fretwell y Trathan, 2021 ; Masello et al., 2006 ; Santangeli et al., 2022 ; Suwanrat et al., 2015 ). Todos estos métodos tienen ventajas y limitaciones en cuanto a viabilidad, costos o perturbaciones a la vida silvestre, pero una característica común es que los conteos manuales involucrados suelen consumir mucho tiempo (Bowler et al., 2020 ; Kellenberger et al., 2021 ; Wang et al., 2019 ). Hoy en día, el uso creciente de técnicas de análisis de imágenes está facilitando conteos de vida silvestre más eficientes (Acevedo y Villanueva-Rivera, 2006 ; Grenzdörffer, 2013 ; Hollings et al., 2019 ; Youngflesh et al., 2021 ). Algunos algoritmos de aprendizaje automático supervisado, en particular aquellos capaces de realizar una regresión de un mapa de densidad, permiten la detección de una gran cantidad de individuos a partir de imágenes con un esfuerzo manual y una inversión de tiempo reducidos (Fiaschi et al., 2012 ; Lempitsky y Zisserman, 2010 ; Xie et al., 2018 ). Estos algoritmos de aprendizaje automático se entrenan proporcionándoles muestras de pares de entrada-salida deseados, en lugar de la tarea más compleja de programar reglas para anticipar respuestas para cada entrada posible. Estas entradas son parches de las imágenes originales en las que necesitamos contar objetos, y las salidas son mapas de densidad correspondientes a los parches de entrada (Lempitsky y Zisserman, 2010 ). Las redes neuronales convolucionales (CNN) están diseñadas para procesar datos de píxeles y, por lo tanto, pueden procesar datos organizados en múltiples matrices como fotografías en color, que contienen intensidades de píxeles en los tres canales de color (revisado en LeCun et al., 2015 ; Dujon y Schofield, 2019 ). Las CNN se han utilizado con éxito para contar aves a partir de imágenes en los últimos años (Akçay et al., 2020 ; Borowicz et al., 2018 ; Bowler et al., 2020 ; Hong et al., 2019 ; Kellenberger et al., 2021 ; Liu et al., 2020 ; Wang et al., 2023 ).
El loro barranquero ( Cyanoliseus patagonus ) es un psitaciforme neotropical (Aves) de las regiones arbustivas áridas a semiáridas de Argentina y Chile (Masello et al., 2011 , 2015 ). Son aves coloniales que utilizan piedras blandas o acantilados de tierra, donde las aves excavan sus nidos. Las colonias reproductivas del loro barranquero, particularmente en Argentina, varían mucho en tamaño, y la gran mayoría de ellas oscilan entre 5 y 420 nidos (Masello et al., 2011 , 2015 ). Siguiendo la estratificación del acantilado, las parejas reproductoras del loro barranquero excavan sus madrigueras en las capas más blandas, que varían de 0,6 m a más de 3,5 m de profundidad (Masello et al., 2001 , 2006 ). Las entradas de los nidos tienen una forma aproximadamente elíptica, con el eje mayor horizontal (ancho medio 26,4 cm) y el eje menor vertical (altura media 12,9 cm; Masello et al., 2006 ; véase también el recuadro de la Figura 1 ). Las parejas reproductoras utilizan repetidamente la madriguera que han cavado y profundizado en temporadas anteriores (Masello et al., 2006 ; Masello y Quillfeldt, 2002 ). Sólo una pareja ocupa cada madriguera (Masello y Quillfeldt, 2002 ).
La colonia más grande de loros barranqueros se encuentra en un acantilado frente al océano Atlántico, adyacente al pueblo de El Cóndor, que está cerca del estuario del Río Negro, en el noreste de la Patagonia, Argentina (Masello et al., 2006 ). El acantilado de 30 a 37 m de altura está compuesto principalmente de arenisca perteneciente a la Formación Río Negro (Angulo y Casamiquela, 1982 ; del Río et al., 2005 ). Aunque la parte más occidental del acantilado contiene una capa compacta de arcilla en el fondo, que no es utilizada por los loros, y capas de arenisca blanda en la parte superior (Masello et al., 2006 ). Previamente, estimamos el número de nidos de loros barranqueros mediante conteos manuales a partir de fotografías realizadas por dos personas entrenadas (Masello et al., 2006 ). Esta tarea consumió mucho tiempo dado el enorme tamaño de la colonia de loros barranqueros en El Cóndor. Las entradas de los nidos se identifican fácilmente en las fotografías (Figura 1 ), pero, a veces, los agujeros naturales producidos por la erosión pueden confundirse con nidos de loros. Usando ese método, encontramos que la colonia comprendía 51,412 madrigueras y se extendía ininterrumpidamente por los primeros 9 km del acantilado (Masello et al., 2006 ). Al escalar el acantilado e inspeccionar directamente las madrigueras excavadas por los loros barranqueros, encontramos que el 3.8% de las madrigueras tenían dos entradas que conducían a una sola cámara de nido, el 10% de los nidos estaban colapsados y el 73% de los nidos estaban activos en un sector intensamente estudiado de la colonia. Trabajos previos (Masello et al., 2006 ) demostraron que el número de entradas de nidos, en combinación con la proporción de nidos con dos entradas, la proporción de nidos colapsados y la proporción de nidos activos, proporcionan una buena estimación del tamaño de la población. Con toda esta información, estimamos que la colonia contenía 37.527 nidos activos durante la temporada reproductiva 2001-2002 (Masello et al., 2006 ). Un estudio posterior mostró que la colonia creció más hacia el oeste, alcanzando una longitud de 12,5 km a finales de la década de 2000 (Llanos et al., 2011 ), un proceso que continúa en la actualidad. En diciembre de 2021, medimos una extensión de la colonia de 18,1 km. La colonia El Cóndor es de suma importancia para la conservación de los loros barranqueros: el 71% de la población mundial se reproduce en El Cóndor (Masello et al., 2011 ; Masello & Quillfeldt, 2012 ). En consecuencia, cualquier amenaza que afecte a la colonia El Cóndor podría afectar por completo a toda la especie. Además, esta colonia también se considera la colonia de psitaciformes más grande conocida en el mundo (Masello et al., 2006) .). Sin embargo, se ve seriamente amenazada por la fuerte tala de la vegetación circundante del Monte y la creciente urbanización en las proximidades del acantilado donde se encuentra la colonia y sobre él (Masello et al., 2011 ; Masello & Balbiano, 2022 ; Masello & Quillfeldt, 2012 ).
En este estudio, aprovechamos las redes neuronales convolucionales para contar el número de entradas a los nidos a partir de fotografías tomadas en la colonia de loros barranqueros El Cóndor. Nuestro objetivo era detectar cambios en el número de entradas a los nidos comparando el conteo actual con el conteo manual anterior y describir mejor la distribución de las entradas a los nidos a lo largo de la colonia, que ahora es más grande. Con todo esto, nuestro objetivo era contribuir con información que pudiera ayudar a la conservación de esta colonia excepcional de psitaciformes.
2 MATERIALES Y MÉTODOS
2.1 Recopilación de datos
Para contar el número total de entradas a los nidos, tomamos 222 fotografías (3000 × 4000 píxeles) en toda la colonia durante la temporada reproductiva 2019-2020 (Tablas 1-3 ). Para que los resultados de este estudio sean comparables con los de Masello et al. ( 2006 ) y para permitir una descripción detallada de la distribución de las madrigueras a lo largo de la colonia, también registramos la posición GPS del inicio de cada kilómetro de la colonia. Al igual que en Masello et al. ( 2006 ), llamamos ‘kilómetro 1’ al kilómetro más oriental de la colonia El Cóndor, y la numeración de kilómetros progresa hacia el kilómetro más occidental de la colonia (‘kilómetro 18’).CUADRO 1. Parámetros correspondientes a los siete diferentes entrenamientos de la arquitectura U-Net, errores de los siete modelos obtenidos y conteos de entradas a nidos por kilómetro de la colonia del loro barranquero Cyanoliseus patagonus en El Cóndor, Río Negro, Argentina.
Correr | Media ± DE | |||||||
---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | ||
Epocas | 80 | 100 | 100 | 100 | 90 | 90 | 100 | – |
Tamaño del lote | 4 | 4 | 4 | 4 | 4 | 4 | 4 | – |
Pérdida de entrenamiento | 0,476 | 0,467 | 0,477 | 0,556 | 0,491 | 0,512 | 0,5 | 0,497 ± 0,30 |
Entrenamiento R 2 a | .97 | .98 | .98 | .96 | .98 | .97 | .97 | .97 ± .01 |
Pérdida de validación | 2.520 | 2.813 | 3.184 | 2.255 | 2.649 | 2.365 | 2.6 | 2,627 ± 0,307 |
Validación R 2 | .67 | .64 | .60 | .53 | .63 | (−) | (−) | .61 ± .05 |
Error absoluto medio b | 3.4 | 4.2 | 1.7 | 2.9 | 2.1 | 2.7 | 1.9 | 2,7 ± 0,9 |
Error absoluto máximo b | 13.9 | 21.6 | 8.6 | 7.5 | 10.3 | 14.7 | 12.7 | – |
La entrada al nido cuenta | Nro. de fotografías | |||||||
---|---|---|---|---|---|---|---|---|
Kilómetro 1 | 6625.3 | 6722.8 | 4967.1 | 8809.1 | 6384.8 | 6218.6 | 5938.7 | 29 |
Kilómetro 2 | 5704.8 | 4848.5 | 4721.5 | 6714.2 | 4364.4 | 5003.4 | 5066.5 | 10 |
Kilómetro 3 | 8187.6 | 6907.3 | 7503.6 | 9590.0 | 7069.2 | 7548.4 | 7623.0 | 10 |
Kilómetro 4 | 5237.4 | 4624.1 | 4917.8 | 6153.9 | 4950.5 | 4969.1 | 5015.9 | 6 |
Kilómetro 5 | 6186.6 | 6004.0 | 5362.8 | 6594.0 | 5286.0 | 5989.0 | 5494.4 | 10 |
Kilómetro 6 | 9896.7 | 9741.3 | 8099.0 | 10.671,9 | 8237.2 | 9816.1 | 8314.0 | 40 |
Kilómetro 7 | 5974.5 | 5980.3 | 5287.2 | 6416.8 | 4797.8 | 6079.0 | 5264.3 | 18 |
Kilómetro 8 | 4996.2 | 4731.4 | 4725.2 | 5451.1 | 4240.7 | 5018.8 | 4550.2 | 14 |
Kilómetro 9 | 2064.6 | 2012.2 | 1864.0 | 2327.7 | 1627.3 | 2118.8 | 1787.4 | 10 |
Kilómetro 10 | 2843.0 | 2885.1 | 2637.7 | 2902.0 | 2427.3 | 2841.3 | 2366.4 | 15 |
Kilómetro 11 | 666,5 | 691.0 | 627.3 | 892.0 | 611.7 | 662.0 | 564.2 | 9 |
Kilómetro 12 | 165.0 | 199.0 | 181,5 | 271.7 | 151,8 | 151.2 | 179,5 | 6 |
Kilómetro 13 | 412.0 | 406,5 | 520.3 | 534.1 | 454,5 | 442.3 | 425,9 | 5 |
Kilómetro 14 | 586.6 | 531.1 | 1137.1 | 1100.3 | 726.2 | 610.4 | 750.1 | 7 |
Kilómetro 15 | 66.1 | 189,4 | 167,8 | 264,5 | 127,9 | 208.3 | 136,5 | 4 |
Kilómetro 16 | 1285.3 | 1288.0 | 965.9 | 1408.7 | 1052.6 | 1133.0 | 961.0 | 16 |
Kilómetro 17 | 1711.3 | 1442.0 | 1269.0 | 1663.7 | 1334.2 | 1408.3 | 1280.0 | 12 |
Kilómetro 18 | 92.2 | 93.2 | 61.1 | 105.5 | 72,5 | 80.7 | 71.7 | 1 c |
Colonia total | 62.701,7 | 59.297,2 | 55.015,9 | 71.871,2 | 53.916,6 | 60.298,7 | 55.789,7 | 222 |
Colonia total media | 59.842 |
- Nota : (−) denota un colapso durante todo el entrenamiento.
- a Las pérdidas y R 2 corresponden a la última época de entrenamiento.
- b Sobre los parches de prueba.
- c Durante la temporada reproductiva 2019-2020, solo los primeros 100 m del ‘kilómetro 18’ (ver Sección 2 ) contenían nidos de loro barranquero y, por esa razón, solo tomamos una fotografía.
Tomamos fotografías desde la playa que se forma al pie del acantilado con la colonia de loros barranqueros durante la marea baja. A la playa solo se puede acceder desde su parte más oriental (kilómetro 1) y utilizando los accesos peatonales y para vehículos ubicados al inicio del kilómetro 2 (llamado ‘Segunda Bajada del Faro’), en el kilómetro 15 (‘El Espigón’), y al inicio del kilómetro 17 (‘Playa Bonita’). Esto, combinado con el hecho de que las aguas del océano llegan al fondo del acantilado durante la marea alta, limitó la accesibilidad a la colonia durante el trabajo de campo, e impuso restricciones sobre cuándo se podía realizar el trabajo de campo. Asimismo, el número de fotografías por kilómetro de la colonia varió dependiendo de las mareas durante el trabajo de campo (Tablas 1–3 ). Durante la marea baja, uno de nosotros (MF) pudo tomar fotografías desde más lejos del acantilado, lo que resultó en una mayor porción del acantilado incluida por fotografía (unos 200 m). A medida que se acercaba la marea alta, el fotógrafo se vio obligado a tomar fotografías más cerca del acantilado, capturando así porciones más cortas del mismo (unos 50 m). Como durante la marea alta no fue posible tomar fotografías, y dado el considerable tamaño de la colonia de loros barranqueros en El Cóndor, nos vimos obligados a tomar las fotografías durante un período de 4 días. En consecuencia, las fotografías muestran pequeñas diferencias en la iluminación. Para reducir las diferencias en la iluminación, elegimos días nublados para evitar sombras demasiado fuertes. Según nuestra experiencia con los conteos manuales (Masello et al., 2006 ), las sombras causan dificultades en el conteo de las entradas de los nidos.
2.2 Preprocesamiento y entrenamiento
Las fotografías consecutivas se superpusieron ligeramente entre sí. Para evitar contar los nidos dos veces, marcamos cada fotografía con dos líneas amarillas verticales que delimitaban, a la derecha y a la izquierda, la parte de la imagen que era única (Figura 1) . ). En los pasos siguientes, solo se utilizó la parte única de cada fotografía. Añadimos un detector de líneas a los algoritmos de conteo (ver más abajo) para permitirles la identificación de las partes únicas de cada fotografía. Sin embargo, en algunas fotografías, detectamos otras líneas cercanas a la horizontal que las líneas amarillas delimitadoras, que se debían al ruido de fondo en las imágenes relacionadas con la litología del acantilado. Para solucionar este problema, calculamos la pendiente de las líneas e identificamos las líneas amarillas delimitadoras como las que estaban cerca de la vertical. Eliminamos las líneas con una tangente menor de 5, que corresponden a ángulos menores de 78,7°.
Nuestros análisis se basan en la metodología desarrollada por Lempitsky y Zisserman ( 2010 ) para el recuento visual de objetos. Este marco de aprendizaje supervisado, adecuado para cualquier característica visual específica del dominio, está entrenado para predecir con precisión los mapas de densidad de objetos a partir de imágenes de entrada (Lempitsky y Zisserman, 2010 ). Una vez que se obtienen los mapas de densidad inferidos, el recuento de objetos se logra a través de un proceso de integración matemática posterior que simplemente suma los valores de píxeles de los mapas de densidad. El proceso de aprendizaje para inferir dicha densidad implica minimizar una función de costo cuadrático de riesgo regularizado (Fiaschi et al., 2012 ; Lempitsky y Zisserman, 2010 ; Xie et al., 2018 ). Este método requiere un conjunto de imágenes de entrenamiento con anotación, pero en lugar de utilizar un cuadro delimitador o una anotación con precisión de píxeles, aprovecha la supervisión punteada (Lempitsky y Zisserman, 2010 ). En este caso, las instancias de objetos presentes en las imágenes de entrenamiento se anotan utilizando un solo punto en cada una de ellas. Según Lempitsky y Zisserman ( 2010 ), la anotación de puntos es la forma natural de contar objetos para los humanos, requiere menos trabajo y ofrece información espacial adicional que las anotaciones tradicionales de cuadros delimitadores o con precisión de píxeles. Estas imágenes de entrenamiento, aumentadas con anotaciones de puntos, permiten que el marco desarrollado por Lempitsky y Zisserman ( 2010 ) aprenda a contar la cantidad de instancias de objetos en imágenes nunca antes vistas. Para producir los mapas de densidad verificados en tierra necesarios para entrenar la CNN para el reconocimiento de patrones, seleccionamos 156 parches (también llamados «regiones» en Lempitsky y Zisserman, 2010 ) de 256 × 256 píxeles (por ejemplo, la Figura 2a ). Seleccionamos aleatoriamente esos parches de entrenamiento de las fotografías originales (por ejemplo, Figura 2a ), utilizando un programa de manipulación de imágenes (GIMP 2.8.10, Spencer Kimball, Peter Mattis y el equipo de desarrollo de GIMP), y los guardamos como archivos de gráficos rasterizados (gráficos de red portátiles, png). Los parches de entrenamiento incluyeron partes del acantilado con nidos que fotografiamos bajo condiciones de luz o distancias al acantilado ligeramente diferentes para tener en cuenta la variabilidad en la calidad de las fotografías originales. Los parches tomados para fines de entrenamiento fueron mucho menos numerosos y, para mejorar la generalización, no coincidieron en posición con parches posteriores generados a lo largo de la cuadrícula, necesarios para inferir mapas de densidad antes del proceso de recuento completo de colonias. La cantidad de parches de entrenamiento que produjimos representa un compromiso entre el tiempo invertido para anotarlos y la calidad de los resultados obtenidos durante las pruebas de CNN. Como siguiente paso, uno de nosotros, con amplia experiencia en el recuento de entradas de nidos de loro barranquero a partir de fotografías (JFM; Masello et al., 2006, 2011 ), anotamos completamente esos parches de entrenamiento marcando manualmente el centro aproximado de cada entrada de nido con un punto de 1 × 1 píxel, también usando GIMP 2.8.10 (Figura 3 , puntos 1). Posteriormente, creamos una nueva imagen png, compuesta por un fondo uniforme y los puntos simples de anotación, que ubican espacialmente las entradas de nido (Figura 3 , puntos 1), siguiendo la metodología de Lempitsky y Zisserman ( 2010 ). De esta manera, pudimos usar la información espacial contenida en las imágenes, con el conteo de los puntos de anotación representando el conteo real de las instancias de objeto (entradas de nido en nuestro caso particular) en las fotografías. Usamos puntos de anotación rojos y un fondo negro (Figura 3 ), pero se podrían haber usado otros colores para el mismo propósito (es decir, para producir puntos simples y fondos uniformes). Además, realizamos un aumento geométrico de los datos aplicando un volteo horizontal, ya que la forma aproximadamente elíptica de las entradas de los nidos no permitía realizar un volteo vertical. Se ha demostrado que el volteo horizontal mejora el tamaño y la calidad de los conjuntos de datos de entrenamiento (Shorten y Khoshgoftaar, 2019 ). De esta manera, pudimos duplicar el número total de parches de entrenamiento de 156 a 312. Finalmente, difuminamos los puntos utilizando una convolución gaussiana (también llamada desenfoque o suavizado gaussiano; Chandel y Gupta, 2013 ; Gedraite y Hadad, 2011 ) para crear mapas de densidad verificados en el terreno (Figura 3 , mapa de densidad gt 1). Cuando el biólogo experto anota el centro aproximado de las entradas de los nidos, utiliza un píxel de valor 1 por entrada de nido. Al aplicar una convolución gaussiana en las proximidades de un píxel aislado con un valor de 1, el valor se extiende a sus píxeles vecinos, creando un efecto borroso. El píxel en sí conserva el valor más alto, mientras que los valores de los píxeles vecinos disminuyen con la distancia, formando una curva suave en forma de campana centrada en el píxel original. Esto da como resultado un gradiente de valores que pasa suavemente del píxel central hacia afuera. Todos los píxeles de esta área ahora tienen valores inferiores a 1. Los píxeles más alejados del centro de esta campana tienen valores muy bajos, mucho menores que 1. Siguiendo a Waithe ( 2017 ), escalamos los mapas de densidad de 0,0-1,0 a 0,0-255,0; de lo contrario, la red tiene dificultades para aprender los valores objetivo muy pequeños producidos por la convolución gaussiana. Posteriormente, redujimos la escala de esos valores a valores válidos de densidad, 0,0-1,0 (Waithe, 2017 ).). Para mejorar el rendimiento de generalización del modelo, dividimos los datos en conjuntos de entrenamiento, validación y prueba. Esto sirve para entrenar el modelo en el conjunto de entrenamiento, ajustar los hiperparámetros utilizando el conjunto de validación y evaluar el rendimiento del modelo final en el conjunto de prueba. El objetivo del proceso de entrenamiento es lograr un nivel de generalización que permita al modelo manejar de manera efectiva datos nuevos e invisibles en los conjuntos de validación y prueba. Para una buena generalización, es importante asegurarse de que los conjuntos de entrenamiento, validación y prueba tengan distribuciones estadísticas similares (Borovicka et al., 2012 ). Aunque no hay sugerencias de división definitivas y cada caso debe examinarse individualmente, es típico usar una distribución 80/10/10, seleccionando aleatoriamente 80% de entrenamiento, 10% de validación y 10% de prueba. Sin embargo, una mayor proporción de datos asignados para entrenamiento facilita que el modelo aprenda relaciones más complejas, y un conjunto de prueba más pequeño es suficiente si refleja la distribución estadística del conjunto de entrenamiento. Para aproximarnos a esta similitud entre conjuntos en la distribución estadística, realizamos siete entrenamientos diferentes para cada una de las tres arquitecturas utilizadas (U-Net, ResUnet y DeepLabv3; Chen et al., 2018 ; Ronneberger et al., 2015 ; Zhang et al., 2018 ), barajando aleatoriamente los 312 parches y dividiéndolos en 256 parches para entrenamiento, 40 parches para validación y 16 parches de prueba cada vez. Es obligatorio mantener el mismo orden de los parches de imagen original y los parches verificados en tierra correspondientes durante la baraja y la división. Luego, se promediaron los resultados de cada una de las siete ejecuciones para proporcionar una estimación final del rendimiento del modelo.
2.3 Algoritmos utilizados y recuentos de nidos
Utilizamos tres arquitecturas CNN diferentes, U-Net, ResUnet y DeepLabv3 (Chen et al., 2018 ; Ronneberger et al., 2015 ; Zhang et al., 2018 ), para predecir mapas de densidad, que luego integramos matemáticamente para contar el número total de entradas de nidos en las 222 fotografías que tomamos en todo el acantilado con la colonia de loros barranqueros en El Cóndor (Tablas 1-3 ).
La arquitectura U-Net fue desarrollada originalmente para segmentar imágenes biomédicas (Ronneberger et al., 2015 ). Adaptamos esta CNN para realizar una regresión de los mapas de densidad requeridos (Waithe, 2017 ; Zanellato, 2021 ). El recuento de objetos se derivó integrando las intensidades de los píxeles sobre los mapas de densidad. La arquitectura U-Net es simétrica e incluye un codificador, un cuello de botella y un decodificador con conexiones de salto que copian mapas del codificador al decodificador, mejorando el rendimiento de la red al preservar la información. Para construir la red, seguimos a Paul ( 2018 ), utilizando un tamaño de entrada de 256 × 256 píxeles, tres canales RGB, activación de unidad lineal rectificada (Relu; Lin & Shen, 2018 ), el mismo relleno y una caída del 15% en los dos últimos bloques del codificador, totalizando 31.032.837 parámetros. Para la compilación, empleamos el optimizador Adam (Kingma & Ba, 2015 ) con una tasa de aprendizaje inicial 1e −4 , una función de pérdida rmse (error cuadrático medio; Hodson, 2022 ) y R 2 como métrica de entrenamiento. rmse cuantifica los errores de predicción, ponderando más fuertemente los errores más grandes (Hodson, 2022 ). La retropropagación calcula los gradientes de la función de pérdida para actualizar los parámetros en la dirección que minimiza la pérdida (LeCun et al., 1998 ). El optimizador Adam adapta las tasas de aprendizaje para un entrenamiento eficiente. Entrenamos la red para 100 épocas con un tamaño de lote de cuatro usando las GPU disponibles en la plataforma Google Colaboratory ( http://colab.research.google.com/ consultado el 11 de abril de 2024), típicamente Tesla T4. Algunas ejecuciones se ejecutaron con la opción pro, GPU Nvidia V100 o A100.
ResUnet combina el aprendizaje residual con U-Net para la segmentación de imágenes y la regresión de mapas de densidad. Adaptado de Zhang et al. ( 2018 ), emplea unidades residuales en una arquitectura similar a U-Net. Usamos el repositorio nikhilroxtomar en GitHub (Tomar, 2019 ) para la implementación.
DeepLabv3 segmenta objetos en múltiples escalas ajustando el campo de visión del filtro y controlando la resolución de las características con diferentes tasas de convolución (Chen et al., 2018 ). Utilizando el repositorio nikhilroxtomar (Tomar, 2021 ), adaptamos esta red, desarrollada inicialmente para la segmentación de imágenes humanas, para realizar regresiones de mapas de densidad. El codificador utiliza ResNet50 con pesos “Imagenet” disponibles en la biblioteca Tensorflow Keras ( https://keras.io/api/applications/ ; Krizhevsky et al., 2017 ; Zeiler & Fergus, 2014 ) e implementa Atrous Spatial Pyramid Pooling (ASPP) con convoluciones atrous a diferentes tasas para codificar objetos a múltiples escalas (Chen et al., 2017 ). Los mapas de activación se muestrearon para que coincidieran con el tamaño de la imagen de entrada.
Las arquitecturas implementadas normalmente utilizan activación sigmoidea en la salida de la red (Tomar, 2019 ), con una máscara binaria con valor de píxel 1 y un fondo con valor de píxel 0, lo que restringe los valores de salida de la función sigmoidea a 0,0-1,0. Después de seguir la recomendación de Waithe ( 2017 ), aumentando los valores de densidad en los parches verificados en tierra de 0,0-1,0 a 0,0-255,0, necesitábamos una función de activación adecuada. Seleccionamos la función de activación Relu, que no está restringida en el rango positivo del eje de ordenadas (Lin y Shen, 2018 ). Posteriormente, descalificamos los mapas de densidad predichos al rango de 0,0-1,0 antes de contar.
Después de la fase de entrenamiento, probamos los modelos en los 16 parches de prueba seleccionados aleatoriamente, trazamos los mapas de densidad previstos y contamos los objetos (Figura 4 ). Para cada uno de los parches de prueba, calculamos el error de conteo, es decir, la diferencia entre el conteo real de nidos y el conteo predicho de nidos. El conteo real de entradas de nidos es simplemente la suma de todos los píxeles individuales con valor uno, que representa el centro de cada entrada de nido en los parches de entrenamiento punteados. El conteo predicho de entradas de nidos es la suma de los valores de píxeles de todo el mapa de densidad predicho, después de la reducción de escala mencionada anteriormente de las intensidades de píxeles al rango 0,0-1,0. En algunos casos, el error de conteo es positivo, en otros es negativo. A continuación, calculamos el error absoluto medio (MAE) de los 16 parches de prueba.
Los modelos de entrenamiento en diferentes mezclas de datos pueden proporcionar estimaciones más sólidas del rendimiento del modelo y ayudar a comprender mejor la variabilidad de los resultados (Haochen & Sra, 2019 ). Por lo tanto, decidimos entrenar siete modelos diferentes para cada una de las tres arquitecturas, equilibrando el tiempo y los recursos disponibles con la calidad de los resultados. Para realizar siete entrenamientos diferentes para cada una de las arquitecturas CNN utilizadas, cambiamos la semilla para seleccionar aleatoriamente los parches de entrenamiento, validación y prueba sobre el total de 312 parches disponibles. Durante el entrenamiento, rastreamos las pérdidas de entrenamiento y validación, y el R 2 de entrenamiento y validación . Para la arquitectura U-Net, después del número total de épocas, alcanzamos un R 2 de entrenamiento superior a .96 para todos los casos, y un rango mínimo-mediano-máximo de R 2 de validación. de validación de .53–.63–.67. Para la arquitectura ResUnet, el R 2 de tren alcanzado fue superior a .97 para todos los casos, y el rango correspondiente de R 2 de validación fue .43–.49–.58. Finalmente, para la arquitectura DeepLabv3, después del número total de épocas, el tren R 2 estuvo por encima de .97 para todos los casos, y el mismo rango de validación R 2 fue .53–.63–.69.Finalmente, cuadriculamos las 222 fotografías originales, que cubrían toda la colonia de loros barranqueros, en parches de 256 × 256 píxeles, como se muestra en la Figura
2b , los pasamos a través del modelo y realizamos los recuentos de entradas de nidos. Pero, en la primera etapa de nuestro trabajo, cuando comenzamos a entrenar los modelos solo con parches que contenían entradas de nidos, al trazar mapas de densidad predichos y contar objetos en ellos, observamos un notable sobreconteo de entradas de nidos. El algoritmo estaba detectando falsos positivos en varios parches correspondientes a sectores del acantilado sin entradas de nidos y parches que incluían el cielo sobre el acantilado o la playa que se forma debajo del acantilado durante la marea baja. Para corregir este problema, agregamos al conjunto de entrenamiento parches pertenecientes a esas áreas (40% de los parches), donde el mapa verificado en tierra era un mapa vacío (por ejemplo, el parche 301 en la Figura
4 ). Esta acción afectó el
curvas R 2 del entrenamiento, que en ocasiones colapsaron a valores negativos muy grandes (Figura
5 ). Según la ecuación
R 2 , esta es una posibilidad cierta si las predicciones son muy inexactas, es decir, los valores reales son muy diferentes de los valores predichos. La suma de la diferencia al cuadrado en el numerador del segundo término está precedida por un signo negativo:dóndedenota los valores reales,los valores previstos, ylas medias aritméticas de la clase.
R 2 = 1 describe una predicción perfecta, mientras que
R 2 = 0 implica que el modelo entrega la media aritmética como predicción. Es por esto que una validación
R 2 alrededor de .5, como la reportada para ResUnet, es en realidad adecuada.
R 2 se utiliza para evaluar qué tan bien las variables independientes en un modelo de regresión explican la variabilidad observada en la variable dependiente. Es una métrica útil para evaluar la bondad del ajuste del modelo a los datos (Draper & Smith,
1998 ). Lo que es realmente importante son los valores y la tendencia de las curvas de pérdida ya que son las que cambian los pesos de la red. Si la curva de pérdida de validación muestra una tendencia creciente a partir de un cierto punto, estamos frente a un problema de sobreajuste. En nuestro caso, sin embargo, las pérdidas siempre se minimizaron, y
R 2 , cuando era positivo, aumentaba, el entrenamiento proseguía y el sobreconteo se solucionaba. Nunca observamos un sobreajuste notable en nuestro entrenamiento.
Comprobamos las desviaciones de la normalidad con pruebas de Kolmogorov-Smirnov. En los casos en los que los datos no se distribuyeron normalmente, proporcionamos medianas y rangos. Dividimos los recuentos de nidos por kilómetro de la colonia para permitir comparaciones con nuestro estudio anterior y detectar posibles cambios en la distribución de nidos a lo largo de la colonia de loros barranqueros (Masello et al., 2006 ).
3 RESULTADOS
En las 222 fotografías de la colonia de loros barranqueros El Cóndor, la arquitectura U-Net contabilizó una media de 59.842 (rango, 53.916,6–71.871,2) entradas de nidos (Tabla 1 ), mientras que DeepLabv3 contabilizó 46.193 (35.943,0–53.605,9; Tabla 2 ), y ResUnet 52.863 (43.210,4–71.158,2; Tabla 3 ). Descubrimos que la arquitectura U-Net tuvo el menor error medio (2,7 entradas de nidos, rango, 1,7–4,2) y el máximo error absoluto (21,6 objetos en un parche) en los parches de prueba (Tabla 1 ). Para DeepLabv3, el error medio fue de 3,6 entradas de nido (rango 2,4-4,9), con un error absoluto máximo de 29,7 objetos en un parche (Tabla 2 ), mientras que para ResUnet, el error medio fue de 4,1 entradas de nido (rango 1,8-7,9), con un error absoluto máximo de 30 objetos en un parche (Tabla 3 ).TABLA 2. Parámetros correspondientes a los siete entrenamientos diferentes de la arquitectura DeepLabv3, errores de los siete modelos obtenidos y conteos de entradas a nidos por kilómetro de la colonia del loro barranquero Cyanoliseus patagonus en El Cóndor, Río Negro, Argentina.
Correr | Media ± DE a | |||||||
---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | ||
Epocas | 100 | 100 | 100 | 100 | 100 | 100 | 100 | – |
Tamaño del lote | 4 | 4 | 4 | 4 | 4 | 4 | 4 | – |
Pérdida de entrenamiento b | 0,387 | 0,367 | 0,366 | 0,388 | 0,378 | 0.350 | 0,403 | 0,377 ± 0,018 |
Entrenamiento R 2b | .99 | .99 | .99 | .99 | (−) | .99 | .99 | .99 |
Pérdida de validación | 2.227 | 2.236 | 2.252 | 2.362 | 2.485 | 2.399 | 2.483 | 2,349 ± 0,113 |
Validación R 2 | (−) | (−) | .686 | .682 | .574 | (−) | .530 | .618 ± 0.078 |
Error absoluto medio c | 2.7 | 2.4 | 4.6 | 3.3 | 4.9 | 3.3 | 4 | 3,6 ± 0,94 |
Error absoluto máximo c | 22.3 | 22.8 | 29.2 | 15.9 | 19 | 12.6 | 29.7 | – |
La entrada al nido cuenta | Nro. de fotografías | |||||||
---|---|---|---|---|---|---|---|---|
Kilómetro 1 | 6509 | 9334.2 | 4924.2 | 6677.2 | 7477 | 5344.3 | 7739.8 | 29 |
Kilómetro 2 | 3551.1 | 4367.7 | 2726.6 | 4922.6 | 4056.4 | 3768.8 | 3564.9 | 10 |
Kilómetro 3 | 5027.9 | 5785.5 | 3933.1 | 7136.6 | 5079.4 | 5666.7 | 4457.2 | 10 |
Kilómetro 4 | 3077.6 | 3785.6 | 2567.4 | 5023.4 | 3023.6 | 3540.9 | 2968.3 | 6 |
Kilómetro 5 | 4331.6 | 4958.7 | 3777.9 | 5232.2 | 4778.3 | 4892.9 | 4491.1 | 10 |
Kilómetro 6 | 6309.2 | 7929.4 | 6165.6 | 6789.7 | 7860.4 | 6846.1 | 6663.8 | 40 |
Kilómetro 7 | 4549 | 5375.8 | 4171.3 | 4398.8 | 5250.4 | 4858.1 | 4373.3 | 18 |
Kilómetro 8 | 3243.6 | 3924.5 | 3043.4 | 3488.7 | 4101.9 | 3714.6 | 3133.6 | 14 |
Kilómetro 9 | 1532.9 | 1790.6 | 1431.6 | 1455 | 2025.5 | 1720.5 | 1420.3 | 10 |
Kilómetro 10 | 1595.3 | 2280.5 | 1503.1 | 1488.5 | 2207.6 | 1747.4 | 1718.5 | 15 |
Kilómetro 11 | 353,9 | 675.9 | 278.1 | 2020.1 | 1197.2 | 487.3 | 374.2 | 9 |
Kilómetro 12 | 142.2 | 309.7 | 108.3 | 1053.2 | 824.5 | 140.8 | 179,5 | 6 |
Kilómetro 13 | 219.6 | 458.1 | 157.3 | 695.7 | 525,7 | 312.7 | 207.7 | 5 |
Kilómetro 14 | 299,9 | 617.9 | 152,8 | 521.6 | 624.8 | 417,7 | 261.6 | 7 |
Kilómetro 15 | 165.2 | 315.1 | 81.6 | 210.5 | 366.2 | 188.2 | 98.8 | 4 |
Kilómetro 16 | 528.3 | 849,8 | 451.1 | 1219.5 | 830.3 | 638.1 | 577,8 | 16 |
Kilómetro 17 | 530.7 | 769.3 | 429.3 | 646.6 | 718 | 608.8 | 422.4 | 12 |
Kilómetro 18 | 55.1 | 77.6 | 40.3 | 142.1 | 69.3 | 52.8 | 40.4 | 1 día |
Colonia total | 42.022,1 | 53.605,9 | 35,943 | 53.122 | 51.016,5 | 44.946,7 | 42.693,2 | 222 |
Colonia total media | 46.193 |
- Nota : (−) denota un colapso durante todo el entrenamiento.
- a Si no se distribuye normalmente, solo se proporciona la mediana.
- b Las pérdidas y R 2 corresponden a la última época de entrenamiento.
- c Sobre los parches de prueba.
- d Durante la temporada reproductiva 2019-2020, solo los primeros 100 m del ‘kilómetro 18’ (ver Sección 2 ) contenían nidos de loro barranquero y, por esa razón, solo tomamos una fotografía.
CUADRO 3. Parámetros correspondientes a los siete diferentes entrenamientos de la arquitectura ResUnet, errores de los siete modelos obtenidos y conteos de entradas a nidos por kilómetro de la colonia del loro barranquero Cyanoliseus patagonus en El Cóndor, Río Negro, Argentina.
Correr | Media ± DE a | |||||||
---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | ||
Epocas | 80 | 80 | 80 | 80 | 80 | 80 | 80 | – |
Tamaño del lote | 4 | 4 | 4 | 4 | 4 | 4 | 4 | – |
Pérdida de entrenamiento b | 0,451 | 0,513 | 0,789 | 0,407 | 0,389 | 0,437 | 0,448 | 0,448 |
Entrenamiento R 2b | .98 | .97 | .97 | .98 | .98 | .99 | .98 | .99 |
Pérdida de validación | 3.520 | 2.934 | 2.686 | 2.800 | 3.830 | 2.656 | 2.888 | 2.888 |
Validación R 2 | (−) | .48 | .49 | .58 | .50 | .43 | (−) | .494 ± .064 |
Error absoluto medio c | 3.4 | 4.6 | 3.8 | 1.8 | 4.6 | 2.5 | 7.9 | 4,1 ± 0,3 |
Error absoluto máximo c | 18.5 | 14.2 | 10.2 | 9.3 | 17.1 | 7.5 | 30 | – |
La entrada al nido cuenta | Nro. de fotografías | |||||||
---|---|---|---|---|---|---|---|---|
Kilómetro 1 | 4153.8 | 5141 | 9267.9 | 6456.7 | 5527.5 | 8069 | 5313.1 | 29 |
Kilómetro 2 | 3805.2 | 3980.4 | 6079.7 | 4740.6 | 3900 | 5757.9 | 4121 | 10 |
Kilómetro 3 | 5340.9 | 5361.9 | 8113.8 | 6143.3 | 5085.8 | 7672.7 | 4974.6 | 10 |
Kilómetro 4 | 3593 | 3447.3 | 5266.3 | 4112 | 3615.2 | 4986.4 | 3374.1 | 6 |
Kilómetro 5 | 4276.3 | 4144 | 6204.5 | 5051.6 | 4710.8 | 5847.1 | 4315.5 | 10 |
Kilómetro 6 | 6975.2 | 7691.5 | 10.939,8 | 8222.7 | 7080.4 | 10,513 | 7017.8 | 40 |
Kilómetro 7 | 4062.6 | 4728 | 6155.5 | 5089.8 | 3813.7 | 6148.2 | 3933.1 | 18 |
Kilómetro 8 | 3757.3 | 4203.7 | 5602.5 | 4403.6 | 3370.8 | 5535.9 | 3503.5 | 14 |
Kilómetro 9 | 1498.8 | 1793.7 | 2360 | 1878.6 | 1295.9 | 2269.5 | 1472.7 | 10 |
Kilómetro 10 | 2124 | 2790.5 | 4011 | 2923.8 | 2017.2 | 3757.7 | 2113.4 | 15 |
Kilómetro 11 | 544.6 | 687.4 | 1142.1 | 663,8 | 582.3 | 1044.6 | 547 | 9 |
Kilómetro 12 | 125.1 | 163,5 | 370.4 | 172.2 | 140.6 | 283.8 | 139,8 | 6 |
Kilómetro 13 | 369.1 | 448,4 | 745.4 | 456.1 | 361,5 | 662,5 | 369.3 | 5 |
Kilómetro 14 | 387.1 | 473,8 | 813.7 | 427,7 | 308,5 | 710 | 362.2 | 7 |
Kilómetro 15 | 127.1 | 92.8 | 209.2 | 91.7 | 86.9 | 197,9 | 77,5 | 4 |
Kilómetro 16 | 894.3 | 958.7 | 1718.9 | 1071.3 | 1074.7 | 1670.7 | 921.6 | 16 |
Kilómetro 17 | 1100.1 | 1124.7 | 1991.3 | 1265.2 | 1251.7 | 1874.5 | 1008.5 | 12 |
Kilómetro 18 | 75,9 | 70.9 | 166.2 | 91.3 | 93.5 | 144,5 | 82.9 | 1 día |
Colonia total | 43.210,4 | 47.302,2 | 71.158,2 | 53.262 | 44.317 | 67.145,9 | 43.647,6 | 222 |
Colonia total media | 52.863 |
- Nota : (−) denota un colapso durante todo el entrenamiento.
- a Si no se distribuye normalmente, solo se proporciona la mediana.
- b Las pérdidas y R 2 corresponden a la última época de entrenamiento.
- c Sobre los parches de prueba.
- d Durante la temporada reproductiva 2019-2020, solo los primeros 100 m del ‘kilómetro 18’ (ver Sección 2 ) contenían nidos de loro barranquero y, por esa razón, solo tomamos una fotografía.
En la Figura 6 presentamos la distribución de las entradas a los nidos en la colonia de loros barranqueros de El Cóndor . Todos los modelos para las tres arquitecturas CNN utilizadas revelaron el mismo patrón: mayor número de entradas a los nidos en los kilómetros 1 a 7, el mayor número medio de entradas a los nidos en el kilómetro 6, una disminución relativamente lenta de los kilómetros 8 a 11 y un bajo número de entradas a los nidos de los kilómetros 12 a 18 (Figura 6a–c ).
La arquitectura U-Net mostró la variabilidad más baja entre los modelos (Figura 6a ). Sin embargo, las tres arquitecturas exhibieron una variabilidad más alta en los primeros kilómetros (más al este) de la colonia del Loro Barranquero El Cóndor, principalmente hasta el kilómetro 6. Esta característica fue más evidente en las arquitecturas DeepLabv3 y ResUnet (Figura 6b,c ), que tuvieron una alta variabilidad en los kilómetros 1 a 4.
4 DISCUSIÓN
Utilizando tres arquitecturas CNN diferentes, pudimos contar el número total de entradas de nidos en las 222 fotografías tomadas en El Cóndor, cubriendo toda la colonia de loros barranqueros. La arquitectura U-Net, que mostró el mejor desempeño, contabilizó una media de 59.842 entradas de nidos en línea con los conteos manuales publicados previamente (Masello et al., 2006 ). También están en línea con conteos manuales más recientes (62.913 entradas de nidos; datos no publicados del JFM) realizados también en las mismas imágenes de la temporada reproductiva 2019-2020. Sin embargo, la U-Net muestra 8430 entradas de nidos más que en los conteos publicados previamente y 3071 menos que en el conteo manual más reciente. Estas diferencias pueden tener múltiples orígenes. En primer lugar, las tres arquitecturas CNN mostraron una mayor varianza en los primeros kilómetros, principalmente hasta el kilómetro 6 (Figura 6 ). Este comportamiento fue más evidente para la arquitectura DeepLabv3, que exhibió en general una baja varianza, pero en los kilómetros 1 a 4 mostró una alta varianza (Figura 6b ). Estos errores probablemente se originan en la calidad de las fotografías, que nos vimos obligados a tomar a diferentes distancias del acantilado, desde diferentes ángulos y con condiciones de luz cambiantes. Sin embargo, el bajo error medio de la arquitectura U-Net abre la posibilidad de usar esta metodología para contar las entradas de nidos a partir de fotografías tomadas en otras colonias de loros barranqueros, o incluso de otras aves con hábitos de anidación similares (por ejemplo, Petrescu, 1998 ; Wermundsen, 1998 ). Los loros barranqueros actualmente enfrentan una situación de conservación precaria, como lo demuestra una fuerte reducción en el tamaño de las colonias en partes de su rango de distribución (Masello et al., 2015 ). Durante un estudio de colonias de loros barranqueros, pudimos localizar las colonias más activas de la especie (Masello et al., 2011 ). La metodología aquí presentada podría utilizarse para monitorear dichas colonias y producir información actualizada periódicamente sobre el tamaño de la población para informar los programas de conservación.
La diferencia entre los resultados de los conteos actuales y los publicados anteriormente también podría estar relacionada con el cambio en la extensión de la colonia durante el período 2001-2021. En 2001, los nidos de loro barranquero se distribuyeron en 9 km de los acantilados junto al pueblo de El Cóndor (Masello et al., 2006 ), mientras que en 2021, se distribuyeron en el doble de esa extensión: 18 km. Por lo tanto, los conteos actuales de CNN pueden implicar realmente un aumento en el número de entradas de nidos y, en consecuencia, en el tamaño de la población, no siendo el resultado de errores metodológicos. Sin embargo, es muy importante mencionar que el número de entradas de nidos por sí solo no representa directamente el tamaño de la población de loro barranquero en El Cóndor. Como mostramos anteriormente (Masello et al., 2006 ), el número de nidos activos de loro barranquero en una colonia, que refleja mejor el tamaño de la población, también depende de otros parámetros. Debido a los sustratos blandos en los que los loros barranqueros excavan sus madrigueras (Masello et al., 2006 ; Ramirez-Herranz et al., 2017 ), siempre hay una proporción de nidos colapsados naturalmente en una colonia. Los nidos colapsados se pueden distinguir con certeza solo por inspección directa (observación personal del JFM). En El Cóndor, esta proporción aumentó ligeramente de un año a otro, comenzando con un 2% al comienzo de nuestros registros en 1998 (datos no publicados del JFM). Durante la temporada de reproducción 2001-2002, esa proporción fue del 10% (Masello et al., 2006 ). Por lo tanto, el aparente aumento en el número de entradas de nidos sugerido a partir de los conteos actuales de U-Net podría deberse a un aumento en el número de nidos colapsados que ha obligado a los loros barranqueros a cavar más madrigueras y no necesariamente a un aumento en el número de nidos activos. Para probar esta explicación alternativa, o incluso complementaria, necesitaríamos conocer la proporción de nidos activos, información que no se puede obtener a partir de las fotografías utilizadas en este estudio. Los estudios futuros también deberían incorporar la actividad de los nidos, que se puede determinar mediante inspección directa (Masello & Quillfeldt, 2002 ) o mediante grabación de video (Masello et al., 2001 , 2006 ), lo que permite una buena estimación del tamaño de la población (Masello et al., 2006 ).
Las arquitecturas CNN también revelaron cambios en el patrón de distribución de las entradas de nidos en la colonia de loros barranqueros en El Cóndor (Figura 6 ). Yorio y Harris ( 1997 ) mencionaron que, en 1990, la parte más densa de la colonia estaba en el kilómetro 1 (según nuestra definición), un patrón que también observamos durante la temporada reproductiva 1999-2000 (Masello & Quillfeldt, 2002 ). En la temporada reproductiva 2001-2002, los 4 km en el extremo oriental de la colonia fueron los más densamente poblados, con muchas menos entradas de nidos en los 5 km en el extremo occidental, y el mayor número de entradas de nidos ubicadas en el kilómetro 2 (Figura 2 en Masello et al., 2006 ). En 2019-2020, todos los modelos para las tres arquitecturas CNN muestran que el mayor número de nidos-entradas de loro barranquero se encuentra actualmente en el kilómetro 6, y que la parte más densamente poblada de la colonia ahora se extiende hasta el kilómetro 11, alcanzando una extensión total de 18 km (Figura 6 ). Todos estos resultados muestran un desplazamiento del número de nidos-entradas desde el extremo oriental hacia el extremo occidental, que ha ido progresando desde el año 2000 en adelante. Este desplazamiento se puede atribuir a niveles crecientes de perturbación humana en el extremo oriental de la colonia. Como se mencionó por primera vez en Masello et al. ( 2006 ), el pueblo de El Cóndor, que en 1998 se extendía hasta ca. A 400 m al este de la colonia de loros barranqueros, se expandió hacia la colonia, situándose sus últimas edificaciones a menos de 30 m del extremo más oriental de la colonia desde el año 2000. Durante la época de cría 2000-2001, se construyó un aparcamiento en la parte superior del extremo occidental del kilómetro 1. Este aparcamiento desencadenó un fuerte proceso de erosión que afectó a un sector del acantilado situado debajo y a los nidos de loros barranqueros que contenía. Esta puede ser también la razón por la que la proporción de nidos colapsados aumentó del 2% en 1998 al 10% en diciembre de 2001 (Masello et al., 2006 ). Al mismo tiempo, se amplió el acceso para vehículos que se encuentra entre los kilómetros 1 y 2, y se realizó una extracción comercial de arena en la playa de abajo, en las proximidades de dicho acceso para vehículos (Masello et al., 2006 ). La intensa actividad de caza furtiva afectó el kilómetro 1 de la colonia durante 2002-2003. Además, desde 2001, se ha practicado intensamente el parapente, especialmente durante la temporada de vacaciones (diciembre-febrero), que en parte coincide con la temporada de cría del loro barranquero (octubre-diciembre; Masello y Quillfeldt, 2002 ; Masello et al., 2006 ).). Además, en 2015-2016 se construyó un gran monumento a las Malvinas, que incluye varias estructuras pesadas, en la cima del acantilado en el centro del kilómetro 1. El monumento a las Malvinas se amplió en 2017-2018. Por último, en varios períodos desde 1998, y más recientemente durante 2018-2022, un pozo ubicado a unos cientos de metros de la cima del acantilado y a lo largo del kilómetro 1, fue utilizado como vertedero de basura (hoy cerrado y reubicado).
5 CONCLUSIONES Y PERSPECTIVAS
Nuestros resultados demuestran que la CNN, en particular la arquitectura U-Net, proporciona una herramienta confiable para el monitoreo continuo a largo plazo del número de entradas a nidos, a partir de fotografías, en la colonia de loros barranqueros en El Cóndor. También podría usarse para contar nidos en otras colonias de loros barranqueros y nidos de otras aves coloniales que se reproducen en acantilados o en el suelo, pero esto necesitaría probarse en estudios futuros, utilizando datos de entrenamiento específicos para ubicaciones específicas.
De hecho, los resultados aquí presentados refuerzan la necesidad de continuar y mejorar, con el uso de CNN, el monitoreo en El Cóndor. Los fuertes cambios aquí observados en la distribución de las entradas de nidos a lo largo del acantilado en El Cóndor están en línea con un largo historial de perturbaciones inducidas por el hombre. Dado que el número total de entradas de nidos contabilizadas en 2001-2002 y en 2019-2020 son similares, es poco probable que estén relacionadas con cambios en el tamaño de la población. De hecho, esos cambios podrían sugerir que las perturbaciones inducidas por el hombre a la colonia durante los últimos 20 años han obligado a parte de esta población de loros a cavar sus madrigueras en partes del acantilado que anteriormente no se usaban. Por un lado, esto muestra un grado de adaptación por parte del loro barranquero. Por otro lado, como mencionamos anteriormente (Masello et al., 2006 ), una capa de arcilla compacta en la parte más occidental de la colonia (Angulo y Casamiquela, 1982 ) no es adecuada para que los loros excaven sus madrigueras. En el futuro, esta característica del acantilado puede imponer un límite a la capacidad que pueden mostrar los loros ante un mayor aumento de la perturbación inducida por el hombre. El Cóndor alberga la mayor parte de la población reproductora de toda la especie (71%; Masello y Quillfeldt, 2012 , Masello et al., 2011 ), siendo también considerada la colonia de Psittaciformes más grande conocida en el mundo (Masello et al., 2006 ). Por lo tanto, las amenazas que afectan actualmente a esta colonia, o las futuras, podrían tener graves consecuencias para toda la especie, y por lo tanto, deben abordarse rápidamente con medidas de conservación adecuadas.
CONTRIBUCIONES DEL AUTOR
Gabriel L. Zanellato: Conceptualización (igual); curación de datos (igual); análisis formal (igual); metodología (igual); recursos (igual); software (igual); validación (igual); visualización (igual); redacción – borrador original (igual); redacción – revisión y edición (igual). Gabriel A. Pagnossin: Conceptualización (igual); investigación (igual); redacción – revisión y edición (igual). Mauricio Failla: Metodología (igual); recursos (igual); redacción – revisión y edición (igual). Juan F. Masello: Conceptualización (igual); curación de datos (igual); análisis formal (igual); investigación (igual); metodología (igual); administración de proyectos (igual); recursos (igual); software (igual); supervisión (igual); validación (igual); visualización (igual); redacción – borrador original (igual); redacción – revisión y edición (igual).
EXPRESIONES DE GRATITUD
Agradecemos a Leonardo Russo Lacerna, Verónica y Jorge Seijas, Carolina Leguizamo, Natalia Federico y Lena Gonther por su ayuda con el trabajo de campo y conteos manuales. El trabajo de campo se realizó con permiso de la Dirección de Fauna Silvestre de la Provincia de Río Negro, Argentina (Exp. no. 143089-DF-98) y la Secretaría de Ambiente, Desarrollo Sustentable y Cambio Climático de la Provincia de Río Negro, Argentina (Resolución 238/2020). Financiamiento de Acceso Abierto habilitado y organizado por Projekt DEAL.