Page cover image

📖Diccionario de la IA

La inteligencia artificial (IA) es un campo fascinante y en constante evolución. A pesar de su creciente presencia en nuestra vida cotidiana, puede resultar complicado entender todos los términos y tecnologías que la componen. En este artículo, quiero hacer un repaso sencillo de los conceptos clave de la IA para ayudarte a comprender mejor cómo funciona y qué significa para el futuro de la salud y la farmacéutica.

¿Qué es la Inteligencia Artificial?

La IA es una rama de la informática que se dedica a crear máquinas capaces de realizar tareas que normalmente requieren de la inteligencia humana, como el reconocimiento de voz, la toma de decisiones o la resolución de problemas complejos. A través de algoritmos y grandes cantidades de datos, las máquinas pueden aprender, adaptarse y mejorar su rendimiento.

Aprendizaje Automático (Machine Learning)

El aprendizaje automático es una subdisciplina de la IA que permite a las máquinas aprender a partir de datos. En lugar de ser programadas para realizar tareas específicas, las máquinas se entrenan usando ejemplos (datos), y luego son capaces de realizar predicciones o clasificaciones.

  • Aprendizaje supervisado: La máquina aprende de un conjunto de datos etiquetados, es decir, con respuestas conocidas. Por ejemplo, identificar imágenes de enfermedades a partir de datos previos.

  • Aprendizaje no supervisado: La máquina busca patrones o estructuras en datos no etiquetados, como agrupar pacientes con características similares sin saber previamente los grupos.

  • Aprendizaje por refuerzo: En este caso, la máquina aprende a través de ensayo y error, mejorando su desempeño con el tiempo al recibir recompensas o penalizaciones

Redes Neuronales Artificiales (ANN)

Las redes neuronales artificiales (ANN) son modelos computacionales inspirados en el funcionamiento del cerebro humano. Están formadas por capas de unidades (o "neuronas") que están conectadas entre sí. Cada conexión tiene un peso que se ajusta a medida que la red aprende. Las ANN son fundamentales para tareas como el reconocimiento de imágenes y el procesamiento de lenguaje natural.

  • Redes profundas (Deep Learning): Cuando las redes neuronales tienen muchas capas, se les llama redes profundas o deep learning. Este tipo de redes permite resolver problemas complejos, como la interpretación de imágenes médicas.

Procesamiento del Lenguaje Natural (NLP)

El procesamiento del lenguaje natural (NLP) es una rama de la IA que se ocupa de la interacción entre las computadoras y el lenguaje humano. Esto incluye tareas como la traducción automática, el análisis de sentimientos o la creación de chatbots.

Visión por Computadora

La visión por computadora permite que las máquinas vean y comprendan el mundo visual. Gracias a la visión por computadora, las máquinas pueden reconocer objetos, identificar patrones y extraer información de imágenes o videos. En salud, se utiliza para analizar imágenes médicas como radiografías o resonancias magnéticas.

IA Explicable (XAI)

La IA explicable (XAI, por sus siglas en inglés) es un campo que busca hacer que los modelos de IA sean más transparentes y comprensibles para los humanos. En sectores como la salud, donde las decisiones pueden tener un impacto importante en los pacientes, es crucial entender cómo y por qué una máquina toma una decisión.

Robótica y Automatización

La robótica es otro campo donde la IA juega un papel fundamental. A través de algoritmos inteligentes, los robots pueden realizar tareas físicas de forma autónoma, desde la cirugía asistida por robots hasta el transporte de medicamentos en hospitales.

IA Cognitiva

La IA cognitiva intenta emular los procesos de pensamiento humano. A través de modelos más complejos, la IA cognitiva puede analizar información, reconocer patrones y adaptarse a nuevas situaciones, lo que es especialmente útil en áreas como la toma de decisiones clínicas.

Backpropagation

El backpropagation es el algoritmo utilizado para entrenar redes neuronales. Funciona de manera que la red ajusta sus pesos (conexiones) de manera iterativa, en función del error que cometió al hacer una predicción, de modo que pueda mejorar en futuros intentos. Este proceso de ajuste de pesos es lo que permite que las redes neuronales aprendan de los datos.

Overfitting y Underfitting

Estos dos términos se refieren a cómo un modelo de IA puede comportarse con los datos de entrenamiento:

  • Overfitting (sobreajuste) ocurre cuando un modelo aprende demasiado bien los detalles y el ruido de los datos de entrenamiento, lo que hace que tenga un mal rendimiento en datos nuevos.

  • Underfitting (subajuste) ocurre cuando un modelo no aprende lo suficiente y no captura las relaciones relevantes en los datos.

El objetivo es encontrar un equilibrio, donde el modelo generaliza bien a nuevos datos.

Funciones de Activación

Las funciones de activación son funciones matemáticas utilizadas en redes neuronales para determinar si una neurona debe activarse o no. Las funciones de activación más comunes incluyen la ReLU (Rectified Linear Unit), que se utiliza en muchas redes profundas, y la sigmoide, que es útil para problemas de clasificación binaria.

Árboles de Decisión y Random Forest

Un árbol de decisión es un modelo predictivo que utiliza una estructura de árbol en la que cada nodo interno representa una decisión basada en una característica del dato, y cada hoja representa un resultado.

  • Random Forest es un conjunto de varios árboles de decisión. Se utiliza para mejorar la precisión del modelo y reducir el riesgo de sobreajuste, combinando las predicciones de varios árboles para obtener una decisión más robusta.

SVM (Máquinas de Vectores de Soporte)

Las máquinas de vectores de soporte (SVM) son un tipo de algoritmo de aprendizaje supervisado utilizado principalmente para clasificación. La idea detrás de SVM es encontrar el hiperplano que mejor separe las clases de datos. Es especialmente útil en problemas de clasificación complejos, como el diagnóstico médico a partir de imágenes o datos clínicos.

Clustering (Agrupamiento)

El clustering o agrupamiento es una técnica de aprendizaje no supervisado que consiste en agrupar objetos similares entre sí. No se necesita etiquetar los datos previamente. Un ejemplo común de clustering en salud sería agrupar pacientes con síntomas similares para identificar patrones de enfermedades.

  • K-Means es uno de los algoritmos de clustering más populares, que divide los datos en un número predefinido de grupos (K

Redes Generativas Antagonistas (GAN)

Las Redes Generativas Antagonistas (GAN) son un tipo de red neuronal en la que dos redes compiten entre sí: una genera datos (como imágenes) y la otra evalúa su autenticidad. Esta competencia lleva a la generación de datos muy realistas, como en la creación de imágenes de alta calidad a partir de datos no estructurados.

En el sector salud, las GAN pueden utilizarse para generar imágenes médicas sintéticas o mejorar la calidad de imágenes existentes.

Transfer Learning (Aprendizaje por Transferencia)

El aprendizaje por transferencia es una técnica en la que un modelo entrenado en un conjunto de datos es reutilizado para otro problema relacionado. En lugar de entrenar un modelo desde cero, el modelo preentrenado se ajusta para resolver nuevas tareas, lo cual es muy eficiente, especialmente cuando los datos son limitados.

Procesamiento del Lenguaje Natural (NLP)

El procesamiento del lenguaje natural (NLP) se refiere a la capacidad de las máquinas para comprender, interpretar y generar el lenguaje humano. En el sector farmacéutico y de salud, el NLP se utiliza para analizar grandes cantidades de texto médico (como historias clínicas, investigaciones o notas de consulta) y extraer información relevante, como diagnósticos o tendencias en tratamientos.

Redes Bayesianas

Las redes bayesianas son un tipo de modelo probabilístico que se utiliza para representar relaciones causales entre variables. A través de la probabilidad, permiten modelar incertidumbres y tomar decisiones informadas. En el ámbito de la salud, las redes bayesianas son útiles para el diagnóstico médico probabilístico.

Reinforcement Learning (Aprendizaje por Refuerzo)

El aprendizaje por refuerzo es un tipo de aprendizaje automático donde un agente toma decisiones secuenciales para maximizar una recompensa. Este enfoque se utiliza en situaciones en las que se necesita optimizar un proceso con múltiples decisiones a lo largo del tiempo, como el ajuste de tratamientos personalizados o la optimización de procesos en la cadena de suministro farmacéutica.

AutoML (Automated Machine Learning)

AutoML (Automated Machine Learning) es el uso de herramientas para automatizar las etapas más complejas del machine learning, como la selección de modelos, el ajuste de parámetros y el preprocesamiento de datos, haciendo que el desarrollo de modelos sea más rápido y accesible incluso para no expertos.

Cache-Augmented Generation (CAG)

La generación aumentada por caché (CAG) es un enfoque novedoso que elimina la necesidad de recuperación en tiempo real en los flujos de trabajo de modelos de lenguaje aprovechando el conocimiento precargado y los estados de inferencia precalculados. En lugar de recuperar documentos de forma dinámica durante la inferencia, CAG integra de antemano toda la información relevante en el contexto extendido de un modelo de lenguaje grande (LLM). Utiliza una caché de clave-valor (KV) precalculada para almacenar y reutilizar los estados de inferencia del modelo, lo que permite realizar tareas de conocimiento optimizadas y sin recuperación.

CAG es particularmente eficaz cuando la base de conocimiento es limitada y puede encajar en el contexto extendido del modelo. Algunos ejemplos incluyen la respuesta a preguntas específicas del dominio, el resumen de documentos y la gestión interna del conocimiento.

CAG se destaca en tareas donde las respuestas rápidas, precisas y contextualmente ricas son esenciales, como: Chatbots de atención al cliente. Análisis de documentos legales y técnicos. Herramientas educativas que requieren explicaciones detalladas.

Model Context Protocol (MCP)

MCP es un protocolo que actúa como un puente entre LLMs y sistemas externos. Proporciona una forma estandarizada para que las aplicaciones faciliten contexto a los LLMs. El protocolo permite un intercambio limpio de información entre el modelo de IA y el mundo exterior. Su objetivo principal es ayudar a los modelos a proporcionar respuestas más precisas y relevantes y permitirles interactuar con el mundo de una manera más parecida a la humana. A medida que los agentes de IA evolucionan y se vuelven más populares, MCP desempeñará un papel crucial en permitirles comprender y responder al mundo que les rodea.

Last updated