
Fernando Merchan, Kenji Contreras, Hector Poveda, Rocio M. Estévez, Hector M. Guzman & Javier E. Sanchez-Galan
Publicado: Enero 07, 2026
La inferencia demográfica a partir de las vocalizaciones es esencial para el seguimiento de los manatíes del Gran Caribe (Trichechus manatus manatus), una especie en peligro de extinción, en entornos tropicales donde la observación directa es limitada. Si bien el monitoreo acústico pasivo ha demostrado su eficacia para la detección de manatíes y la identificación de individuos, la capacidad de clasificar el sexo y la edad a partir de las vocalizaciones sigue sin haberse explorado, lo que limita el conocimiento ecológico sobre la estructura de la población y la dinámica reproductiva. Investigamos si el aprendizaje automático puede clasificar con precisión el sexo y la edad a partir de señales acústicas de manatíes utilizando 1.285 vocalizaciones de 20 individuos silvestres capturados en el río Changuinola, Panamá. Se extrajeron y analizaron características acústicas, incluyendo descriptores de envolvente espectral (MFCC), contenido armónico (croma) y parámetros de frecuencia temporal, utilizando dos conjuntos de características: SET1 (30 características espectral-cepstrales) y SET2 (38 características ampliadas con descriptores explícitos de tono y tiempo). Se entrenaron cuatro algoritmos de clasificación (Random Forest, XGBoost, SVM, LDA) mediante validación cruzada «Leave-One-Group-Out» con sobremuestreo SMOTE para abordar el desequilibrio entre clases. La clasificación de sexo alcanzó una precisión del 85 %-87 % (macro-F1 del 75 %-78 %) con un rendimiento equilibrado en ambas clases (mujeres: 86 %, hombres: 79 %), lo que valida la viabilidad operativa para aplicaciones de monitorización pasiva. Sin embargo, el análisis bootstrap a nivel de sujeto reveló una heterogeneidad individual considerable (mujeres: IC del 95 %: 68,7 %–96,4 %, hombres: 75,1 %–83,6 %), lo que indica que aproximadamente entre el 10 % y el 15 % de los individuos presentan una clasificación errónea sistemática debido a características acústicas atípicas. Las características de la envolvente espectral (MFCC, asimetría espectral) resultaron más discriminatorias que la frecuencia fundamental, lo que sugiere que la variación relacionada con el sexo se manifiesta en los patrones de resonancia del tracto vocal. La clasificación por edad alcanzó una precisión global del 73 %–85 %, pero mostró una grave infradetección de los juveniles (14 %–26 % de recuperación), con intervalos de confianza de bootstrap que abarcaban del 9,3 % al 86,3 % para los juveniles frente al 60,7 %–84,7 % para los adultos. La reducción de dimensionalidad (PCA, t-SNE) reveló un solapamiento sustancial entre las distribuciones de características acústicas de juveniles y adultos, con una estructura de edad más clara visible principalmente en los grupos de hembras, lo que contribuyó a una clasificación errónea sistemática de los juveniles machos. La optimización del umbral mejoró el recuerdo de juveniles al 63 %, pero aumentó los falsos positivos al 37 %, lo que presenta compensaciones para la vigilancia de la conservación. La regresión acústica del tamaño corporal demostró una estimación continua prometedora (MAE = 0,208 m, R² = 0,33), ofreciendo una alternativa a la clasificación categórica por edad al permitir la elaboración de perfiles demográficos aproximados cuando se integra con la inferencia del sexo. Estos hallazgos demuestran la viabilidad operativa de la clasificación acústica del sexo para la conservación de los manatíes, al tiempo que ponen de relieve los retos fundamentales que plantea la inferencia de la edad por categorías, debido a la variación ontogenética continua y al número limitado de ejemplares juveniles. Sin embargo, la regresión acústica del tamaño corporal ofrece un enfoque complementario prometedor, que permite elaborar perfiles demográficos continuos a lo largo de las clases de tamaño, en lugar de categorías de edad discretas. La integración con marcos de identificación individual ya establecidos permitiría llevar a cabo un marcado y recaptura acústicos exhaustivos, estimando simultáneamente la abundancia, las proporciones de sexos, las distribuciones de tamaño y la estructura demográfica a partir de despliegues de hidrófonos a largo plazo, sin necesidad de confirmación visual de las dimensiones corporales.
Journal: Frontiers in Marine Science
