La inteligencia artificial y su capacidad de transformación de la sociedad han experimentado un gran crecimiento en los últimos años. Las soluciones más precisas han llegado en la investigación de arquitecturas profundas, las que cabe incluir en la rama del Deep Learning o aprendizaje profundo. No obstante, estos modelos son muy complejos y constan de millones de parámetros que hacen imposible explicar sus decisiones y predicciones en última instancia. La inteligencia artificial explicable (IAX) surge para dotar de capacidad de interpretación a los modelos de inteligencia artificial. A diferencia de las técnicas basadas en importancia de características, gradientes o perturbaciones, la explicabilidad basada en conceptos o Concept-based Explainable Artificial Intelligence (C-XAI) ofrece resultados más fácilmente comprensibles e interpretables por las personas. Es uno de los subcampos de la IAX más recientes y de mayor proyección y potencial. Este trabajo revisa el estado del arte de la C-XAI, estudiando el significado semántico de las explicaciones y los elementos gramaticales comunes a todos los métodos, y asienta la incipiente taxonomía de la C-XAI. Por primera vez se incluyen también los avances producidos en 2024 y se define claramente el alcance de la revisión: la clasificación de imágenes, el campo que de forma claramente mayoritaria ha sido objeto del desarrollo de estos métodos. Se ofrecen los resultados de explicabilidad más interesantes de la investigación, los resultados de clasificación de todos los métodos revisados y una comparativa de rendimiento y explicabilidad que permita entender el estado de la investigación en C-XAI y la capacidad y limitaciones de estas tecnologías a la fecha de realización de este trabajo.
Abstract:
Artificial intelligence and its ability to transform society have experienced great growth in recent years. The most accurate solutions have arrived in the research of deep architectures, which can be included in the branch of deep learning. However, these models are very complex and consist of millions of parameters that make it impossible to explain their decisions and predictions in the end. The IAX arises to provide artificial intelligence models with interpretability. Unlike techniques based on feature importance, gradients or perturbations, concept-based explainability or C-XAI provides results that are more easily understood and interpretable by humans. It is one of the most recent subfields of IAX with the greatest projection and potential. This paper reviews the state of the art of C-XAI, studying the semantic meaning of the explanations and the grammatical elements common to all methods, and settles the incipient taxonomy of C-XAI. For the first time, the advances produced in 2024 are also included and the scope of the review is clearly defined: image classification, the field that has clearly been the subject of most of the development of these methods. The most interesting explanatory results of the research, the classification results of all the methods reviewed, and a comparison of performance and explanability are provided to understand the state of research in C-XAI and the capacity and limitations of these technologies at the date of this work.
La inteligencia artificial y su capacidad de transformación de la sociedad han experimentado un gran crecimiento en los últimos años. Las soluciones más precisas han llegado en la investigación de arquitecturas profundas, las que cabe incluir en la rama del Deep Learning o aprendizaje profundo. No obstante, estos modelos son muy complejos y constan de millones de parámetros que hacen imposible explicar sus decisiones y predicciones en última instancia. La inteligencia artificial explicable (IAX) surge para dotar de capacidad de interpretación a los modelos de inteligencia artificial. A diferencia de las técnicas basadas en importancia de características, gradientes o perturbaciones, la explicabilidad basada en conceptos o Concept-based Explainable Artificial Intelligence (C-XAI) ofrece resultados más fácilmente comprensibles e interpretables por las personas. Es uno de los subcampos de la IAX más recientes y de mayor proyección y potencial. Este trabajo revisa el estado del arte de la C-XAI, estudiando el significado semántico de las explicaciones y los elementos gramaticales comunes a todos los métodos, y asienta la incipiente taxonomía de la C-XAI. Por primera vez se incluyen también los avances producidos en 2024 y se define claramente el alcance de la revisión: la clasificación de imágenes, el campo que de forma claramente mayoritaria ha sido objeto del desarrollo de estos métodos. Se ofrecen los resultados de explicabilidad más interesantes de la investigación, los resultados de clasificación de todos los métodos revisados y una comparativa de rendimiento y explicabilidad que permita entender el estado de la investigación en C-XAI y la capacidad y limitaciones de estas tecnologías a la fecha de realización de este trabajo.
Abstract:
Artificial intelligence and its ability to transform society have experienced great growth in recent years. The most accurate solutions have arrived in the research of deep architectures, which can be included in the branch of deep learning. However, these models are very complex and consist of millions of parameters that make it impossible to explain their decisions and predictions in the end. The IAX arises to provide artificial intelligence models with interpretability. Unlike techniques based on feature importance, gradients or perturbations, concept-based explainability or C-XAI provides results that are more easily understood and interpretable by humans. It is one of the most recent subfields of IAX with the greatest projection and potential. This paper reviews the state of the art of C-XAI, studying the semantic meaning of the explanations and the grammatical elements common to all methods, and settles the incipient taxonomy of C-XAI. For the first time, the advances produced in 2024 are also included and the scope of the review is clearly defined: image classification, the field that has clearly been the subject of most of the development of these methods. The most interesting explanatory results of the research, the classification results of all the methods reviewed, and a comparison of performance and explanability are provided to understand the state of research in C-XAI and the capacity and limitations of these technologies at the date of this work. Read More





