Joint Modeling of Big Five and HEXACO for Multimodal Apparent Personality-trait Recognition
Masumura, Orihashi, Ihori et al.
This paper proposes a joint modeling method of the Big Five, which has long been studied, and HEXACO, which has recently attracted attention in psychology, for automatically recognizing apparent personality traits from multimodal human behavior. Most previous studies have used the Big Five for multimodal apparent personality-trait recognition. However, no study has focused on apparent HEXACO which can evaluate an Honesty-Humility trait related to displaced aggression and vengefulness, social-dominance orientation, etc. In addition, the relationships between the Big Five and HEXACO when modeled by machine learning have not been clarified. We expect awareness of multimodal human behavior to improve by considering these relationships. The key advance of our proposed method is to optimize jointly recognizing the Big Five and HEXACO. Experiments using a self-introduction video dataset demonstrate that the proposed method can effectively recognize the Big Five and HEXACO.
academic
Modelado Conjunto de Big Five y HEXACO para el Reconocimiento Multimodal de Rasgos de Personalidad Aparente
Este artículo propone un método de modelado conjunto que integra el modelo Big Five, ampliamente investigado, con el modelo HEXACO, recientemente destacado en psicología, para el reconocimiento automático de rasgos de personalidad aparente a partir del comportamiento humano multimodal. Investigaciones previas se han enfocado principalmente en Big Five para el reconocimiento multimodal de personalidad aparente, sin abordar el HEXACO aparente, el cual permite evaluar el rasgo de honestidad-humildad, relacionado con la agresión desplazada, la mentalidad vengativa, la orientación de dominio social y otros factores. Además, la relación entre Big Five y HEXACO en el modelado de aprendizaje automático aún no ha sido claramente establecida. Al considerar estas relaciones, los autores esperan mejorar la capacidad de percepción del comportamiento humano multimodal.
Problema Central: La investigación existente en reconocimiento multimodal de rasgos de personalidad se centra principalmente en Big Five, careciendo de atención hacia HEXACO (particularmente la dimensión de honestidad-humildad)
Importancia: El rasgo de honestidad-humildad en HEXACO muestra una correlación negativa fuerte con agresión desplazada, mentalidad vengativa, orientación de dominio social, conducta inapropiada en el trabajo y otros factores, poseyendo significancia psicológica importante
Limitaciones Existentes:
Falta de investigación en reconocimiento multimodal de rasgos HEXACO aparentes
La relación entre Big Five y HEXACO en modelado de aprendizaje automático no ha sido suficientemente explorada
Los conjuntos de datos existentes están diseñados principalmente para Big Five
Mediante el modelado conjunto de Big Five y HEXACO, aprovechando las relaciones psicológicas entre dos marcos de personalidad, mejorar la robustez y precisión del reconocimiento multimodal de rasgos de personalidad.
Primer Estudio: Primera investigación sobre reconocimiento multimodal de rasgos de personalidad HEXACO aparente
Método de Modelado Conjunto: Propone un método de modelado conjunto de Big Five y HEXACO que mejora el desempeño de reconocimiento de ambos marcos
Exploración de Relaciones: Primer estudio que investiga la relación entre Big Five y otros rasgos de personalidad (HEXACO) en reconocimiento multimodal de personalidad aparente
Contribución de Conjunto de Datos: Construcción de un conjunto de datos de videos de auto-presentación anotados simultáneamente con rasgos Big Five y HEXACO
Dado un video de entrada audiovisual, estimar conjuntamente las puntuaciones de Big Five y^=[y^1,⋯,y^5]⊤ y las puntuaciones de HEXACO z^=[z^1,⋯,z^6]⊤:
{y^,z^}=F(S,U;Θ)
donde S representa características de audio, U representa características visuales, y Θ es el conjunto de parámetros entrenables.
Optimización Conjunta: Optimizar simultáneamente el reconocimiento de Big Five y HEXACO, aprovechando relaciones psicológicas para mejorar el desempeño
Fusión Multimodal: Utilizar arquitectura Transformer preentrenada para procesar información de audio, visual y texto
Modelado de Relaciones: Aprender relaciones latentes entre Big Five y HEXACO mediante aprendizaje de representación compartida
Ventajas del Modelado Conjunto: El modelo conjunto supera a los modelos especializados en la mayoría de los casos
Contribución Modal: Las características de audio son más efectivas, mientras que las características visuales son relativamente efectivas en el reconocimiento de amabilidad
Comparación de Desempeño: El desempeño de reconocimiento automático se aproxima al nivel de evaluación humana
Los resultados experimentales muestran que los patrones de correlación aprendidos por el modelo conjunto son básicamente consistentes con las expectativas psicológicas, pero la correlación se captura excesivamente en ciertos rasgos, lo que indica que aunque el modelo alcanza un desempeño de reconocimiento a nivel humano, no reproduce completamente la forma en que los humanos perciben las impresiones.
Sesgo de Correlación: El modelo captura excesivamente la correlación entre Big Five y HEXACO, sin reproducir completamente los patrones de percepción humana
Limitaciones de Datos: El conjunto de datos contiene solo videos de auto-presentación en japonés, la generalización requiere verificación
Diferencias Culturales: No se consideran las diferencias en la expresión de rasgos de personalidad en diferentes contextos culturales
El artículo cita 36 referencias relacionadas, abarcando teoría de psicología de la personalidad, aprendizaje multimodal, aprendizaje profundo y otros múltiples campos, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo de investigación de alta calidad e interdisciplinario con significancia pionera importante en el campo de la computación multimodal de personalidad. Aunque hay espacio para mejora en profundidad teórica y generalización, su innovación y valor práctico lo convierten en una contribución importante a este campo.