martes, 28 de enero de 2025

Mentes humanas frente a modelos de aprendizaje automático (Marina Tosic y Dee Penco)

 

Explorando los paralelismos y diferencias entre la psicología y el aprendizaje automático, 23-enero 2025

“Mientras que los psicólogos sueñan con un día en que se comprenda por completo la complejidad de la mente humana, o los profesionales de los datos sueñan con un día en que los modelos de IA alcancen la inteligencia artificial general, cada dominio aún conserva su campo único. Sin embargo, el diálogo entre estos dos campos profundiza nuestra comprensión de ambos”. 



El año 2024 fue un año importante en el reconocimiento de las contribuciones del aprendizaje automático y la inteligencia artificial.

El Premio Nobel de Química fue otorgado por los avances en la ciencia de las proteínas: David Baker por la creación de nuevos tipos de proteínas, junto con Demis Hassabis y John Jumper por el desarrollo de un modelo de IA que resolvió un desafío de 50 años de predecir las estructuras complejas de las proteínas.

Además, John Hopfield y Geoffrey Hinton recibieron el Premio Nobel de Física por su trabajo en redes neuronales artificiales, modelos similares al cerebro capaces de reconocer patrones y producir resultados que se asemejan a los procesos de toma de decisiones humanas.

Aunque la inteligencia artificial modela cada vez con mayor precisión la resolución de problemas y la toma de decisiones humanas, aún es necesario comprender plenamente los mecanismos detrás de la cognición humana.

La psicología de la (re)acción humana involucra dimensiones complejas interconectadas, moldeadas por capas de factores conscientes y subconscientes.

—Entonces, ¿qué diferencia a los modelos humanos y de ML/IA a la hora de generar resultados?

Para abordar esta pregunta, exploremos estos dos mundos (la psicología y el aprendizaje automático) y descubramos las conexiones que dan forma al modo en que los humanos y los modelos de IA creados por humanos producen resultados.

Los objetivos de este post son :

  1. Acercar explicaciones de psicología profesional de alto nivel a los lectores técnicos sobre lo que afecta la toma de decisiones humanas.
  2. Muestre el proceso de modelado de aprendizaje automático (ML) de alto nivel y explique cómo los modelos de ML generan resultados para profesionales no técnicos.
  3. Identifique las diferencias y similitudes entre los dos procesos (el humano y la máquina) que producen resultados.

Aspecto psicológico: ¿Cómo generan resultados los seres humanos? | Por Dee

Antes de comenzar a escribir esta sección , quiero enfatizar que todos los psicólogos del mundo estarían encantados si hubiera una manera para que las personas funcionaran de manera más simple, o al menos tan simple como los modelos de IA o ML.

Los expertos en IA y ML probablemente estén horrorizados por lo que acabo de decir porque insinué que “la IA y el ML son simples”.

— Pero esa no era mi intención.

Sólo quiero destacar lo mucho más simples que son estos modelos comparados con las complejidades de los humanos .

Cuando Marina me explicaba a alto nivel cómo funciona el modelado del aprendizaje automático, no pude evitar pensar:

Si pudiéramos “reducir” a los humanos a esta metodología “ sencilla” , curaríamos la mayoría de los problemas psicológicos, transformaríamos vidas para mejor y mejoraríamos drásticamente el bienestar general de la población.

Imagínese si una persona pudiera recibir entradas , pasarlas a algunos algoritmos internos que pudieran determinar el peso , la importancia y la calidad de esa entrada, hacer la predicción más probable y, en base a eso, producir un resultado controlado pensamiento , emoción o comportamiento .

Pero a diferencia del aprendizaje automático o la inteligencia artificial, la mente humana procesa la información de formas mucho más complejas, influenciadas por numerosos factores interconectados.

A partir de este punto, dejaré de especular sobre lo que sucede dentro de un modelo de IA o ML y explicaré el flujo de modelado “humano”.

Para ilustrar el concepto, analizaré varios factores que influyen en la toma de decisiones de los seres humanos.

Para ello, te invito a que imagines a una persona como un “ modelo preentrenado de caja negra”. En otras palabras, un modelo ya viene precargado con patrones de conocimiento y pesos aprendidos en la etapa de entrenamiento.

Estos patrones y pesos o factores varían de persona a persona y se conocen como:

  • (1) Inteligencia y cociente intelectual
  • (2) Mundo emocional y EQ
  • (3) Mundo consciente : lo que el “modelo” ha aprendido hasta ahora: valores, experiencias, propósito
  • (4) Mundo inconsciente y subconsciente: lo que el “modelo” aprendió y reprimió hasta ahora: memoria a corto y largo plazo + (de nuevo) valores, experiencias, propósito
  • (5) Predisposiciones genéticas: con qué nacemos
  • (6) Medio ambiente: social, cultural, físico.
  • (7) Necesidades fisiológicas: Jerarquía de Maslow (Jerarquía de necesidades)
  • (8) Estado hormonal y fisiológico: neurobiología, sistema endocrino, excitación
  • (9) Centros de toma de decisiones: Ello, Yo, Superyó, que separan entidades dentro de nosotros.
  • (10) Intuición y creatividad : pueden considerarse parte de las variables agrupadas anteriormente o entidades separadas por sí mismas (intuición, pensamiento divergente, estado de flujo)

Hasta ahora, hemos identificado 10 factores que varían para cada persona.

Quiero enfatizar que todos ellos están interconectados y a veces tan “fusionados” entre sí que incluso pueden llegar a combinarse .

Además, cada uno puede ser más grueso o más delgado y puede contener “partículas”, o información predominante o deficiente .

  • Por ejemplo, los factores hormonales pueden tener una hormona predominante (como la serotonina , que afecta al estado de ánimo; el cortisol en respuesta al estrés; la dopamina , que es esencial para la excitación, etc.). El factor intelectual puede ser mayor o menor .

Ahora imaginemos que hay algún algoritmo dentro de la persona que reorganiza constantemente el orden de importancia de los factores, de modo que a veces uno puede terminar al frente, a veces en el medio y a veces atrás.

  • Tomemos las necesidades fisiológicas, como el hambre , por ejemplo. Si la colocamos al principio, determinará qué información llega a la segunda, tercera, cuarta, etc.; el resultado dependerá de eso .

En otras palabras, si tomas decisiones mientras tienes hambre , el resultado probablemente no será el mismo que si tuvieras el estómago lleno .

📌 Los factores están ordenados por importancia, con el más importante en el momento específico siempre en la primera posición, luego el segundo, y así sucesivamente.

Lo que acabo de describir brevemente es cómo operan los humanos cuando reciben información de entrada en circunstancias específicas.

🙋🏽‍♀️ Volviendo a la idea introductoria, ¿expliqué por qué los psicólogos de todo el mundo anhelan una experiencia humana más sencilla? ¿Por qué nosotros, de este lado, estaríamos realmente contentos si la gente fuera tan “complicada” como ML?

  • Pensemos solamente en cuántos problemas psicológicos podrían resolverse —dado que los factores psicológicos son fundamentales para todo— y cuántos otros problemas a nuestro alrededor podrían resolverse si tan solo pudiéramos “ajustar” o “reiniciar” nuestros factores tan fácilmente como en el modelo ML.

— Pero ¿qué puedes hacer para controlar mejor tus resultados?

¿Recuerdas la parte que mencioné anteriormente sobre el “espesor” de tus factores? Bueno, dado que el espesor de tus factores y su orden determinan tu resultado (la emoción que sientes, el pensamiento que formas y la reacción a la información), es útil saber que puedes espesar algunos de estos factores para tu beneficio y mantenerlos firmemente en la primera posición.

Lo simplificaré de nuevo con varios ejemplos:
probablemente puedas (y con suerte) asegurarte de no tener hambre nunca. Puedes trabajar en la regulación de tus hormonas. En terapia, puedes abordar tus miedos y trabajar para eliminarlos. Puedes ajustar creencias profundamente arraigadas almacenadas en tu subconsciente, y así sucesivamente. 👉🏼 Nosotros (tú) podemos hacer esto, y es una pena que más personas no trabajen en ajustar sus factores.

Y por ahora dejémoslo así.

Hasta que alguna forma de IA descubra una forma más eficiente de hacer esto o en nuestro lugar, continuaremos tomando ciertas decisiones, sintiendo ciertas emociones y realizando acciones específicas como lo hacemos ahora.

Aspectos del aprendizaje automático: ¿Cómo generan resultados los modelos? | Por Marina

Cuando Dee habló de la “ caja negra humana ” con patrones preentrenados, no pude evitar pensar en lo mucho que se parece al proceso de aprendizaje automático . Así como los humanos tienen múltiples factores interconectados que influyen en sus decisiones, los modelos de aprendizaje automático tienen su versión de esta complejidad.

Entonces, ¿qué es el aprendizaje automático?

Es un subconjunto de la IA que permite a las máquinas aprender de datos pasados ​​(o datos históricos) y luego hacer predicciones o tomar decisiones sobre nuevos registros de datos sin estar programadas explícitamente para cada escenario posible .

Dicho esto, algunos de los “escenarios” de ML más comunes son:

  • Pronóstico o regresión (por ejemplo, predicción de precios de viviendas)
  • Clasificación (por ejemplo, etiquetar imágenes de gatos y perros)
  • Agrupamiento (por ejemplo, encontrar grupos de clientes analizando sus hábitos de compra)
  • Detección de anomalías (por ejemplo, detección de valores atípicos en sus transacciones para el análisis de fraudes)

O, para ejemplificar estos escenarios con nuestras tareas cognitivas diarias humanas, también predecimos (por ejemplo, ¿lloverá hoy? ), clasificamos (por ejemplo, ¿es un amigo o un extraño? ) y detectamos anomalías (por ejemplo, el queso que se echó a perder en nuestro refrigerador ). La diferencia radica en cómo procesamos estas tareas y qué entradas o datos tenemos (por ejemplo, la presencia de nubes frente a un cielo brillante y despejado ).

Por lo tanto, los datos (y su calidad) siempre son el núcleo de la producción de resultados de modelos de calidad a partir de los escenarios anteriores.

Datos: la “entrada” central

De manera similar a los humanos, que recopilan información sensorial multimodal de varias fuentes (por ejemplo, videos de YouTube, música de la radio, publicaciones de blogs de Medium, registros financieros de hojas de Excel, etc.), los modelos de ML se basan en datos que pueden ser:

  • Estructurado (como filas en una hoja de cálculo)
  • Semiestructurado (archivos JSON, XML)
  • No estructurado (imágenes, documentos PDF, texto libre, audio, etc.)

Debido a que los datos alimentan cada conocimiento que produce un modelo de ML, nosotros ( los profesionales de datos ) dedicamos una cantidad sustancial de tiempo a prepararlos, lo que a menudo se cita como el 50-70 % del esfuerzo general del proyecto de ML .

Esta fase de preparación brinda a los modelos de ML una muestra del “filtrado y preprocesamiento” que los humanos realizan naturalmente.

Buscamos valores atípicos, manejamos valores faltantes y duplicados, eliminamos parte de las entradas (características), características innecesarias o creamos otras nuevas.

Además de las tareas mencionadas anteriormente, también podemos "ajustar" las entradas de datos. — ¿Recuerdas cómo Dee mencionó que los factores son "más gruesos" o "más delgados"? — En ML, logramos algo similar a través de la ingeniería de características la asignación de pesos , aunque de una manera completamente matemática.

En resumen, estamos “organizando” las entradas de datos para que el modelo pueda “aprender” de datos limpios y de alta calidad, produciendo resultados de modelo más confiables.

Modelado: Entrenamiento y prueba

Si bien los humanos pueden aprender y adaptar sus “pesos factoriales” a través de prácticas deliberadas, como describió Dee, los modelos de ML tienen un proceso de aprendizaje estructurado de manera similar.

Una vez que nuestros datos están en buen estado, los introducimos en algoritmos de ML (como redes neuronales , árboles de decisión o métodos de conjunto ).

En una configuración típica de aprendizaje supervisado, el algoritmo ve ejemplos etiquetados con las respuestas correctas (como mil imágenes etiquetadas como “gato” o “perro”).

Luego ajusta sus ponderaciones internas (su versión de los “factores de importancia”) para que coincidan (predigan) con esas etiquetas lo más exactamente posible. En otras palabras, el modelo entrenado podría asignar una puntuación de probabilidad que indique la probabilidad de que cada nueva imagen sea un “gato” o un “perro”, en función de los patrones aprendidos.

Aquí es donde el aprendizaje automático es más "sencillo" que la mente humana: los resultados del modelo provienen de un proceso definido de suma de entradas ponderadas, mientras que los humanos barajan múltiples factores (como hormonas, sesgos subconscientes o necesidades físicas inmediatas), lo que hace que nuestro proceso interno sea mucho menos transparente.

Así pues, las dos fases fundamentales en la construcción de modelos son:

  • Entrenamiento : Se muestran los datos etiquetados al modelo. Este “aprende” patrones que vinculan las entradas (características de la imagen, por ejemplo) con las salidas (la etiqueta correcta de la mascota).
  • Pruebas : Evaluamos el modelo con datos nuevos que no hemos visto (nuevas imágenes de gatos y perros ) para medir su capacidad de generalización. Si etiqueta incorrectamente ciertas imágenes de manera constante, podemos modificar los parámetros o recopilar más ejemplos de entrenamiento para mejorar la precisión de los resultados generados.

Como todo vuelve a los datos, es importante mencionar que la parte de modelado puede implicar más, especialmente si tenemos " datos desequilibrados ".

Por ejemplo: si el conjunto de entrenamiento tiene 5000 imágenes de perros pero solo 1000 imágenes de gatos , el modelo podría inclinarse a predecir perros con mayor frecuencia, a menos que apliquemos técnicas especiales para abordar el “ desequilibrio ”. Pero esta es una historia que requeriría una publicación completamente nueva.

La idea detrás de esta mención es que la cantidad de ejemplos en el conjunto de datos de entrada para cada resultado posible (la imagen “gato” o “perro”) influye en la complejidad del proceso de entrenamiento del modelo y su precisión de salida.

Los ajustes en curso y el factor humano

Sin embargo, a pesar de su aparente sencillez, un pipeline de ML no es algo que se pueda " instalar y olvidar ".

Cuando las predicciones del modelo comienzan a desviarse ( quizás porque nuevos datos han cambiado el escenario ), volvemos a entrenar y afinamos el sistema.

Nuevamente , los profesionales de datos detrás de escena necesitan decidir cómo limpiar o enriquecer los datos y reajustar los parámetros del modelo para mejorar las métricas de rendimiento del modelo.

Eso es el “ reaprendizaje ” en el aprendizaje automático.

Esto es importante porque los sesgos y errores en los datos o modelos pueden tener repercusiones en los resultados y tener consecuencias en la vida real . Por ejemplo, un modelo de calificación crediticia entrenado con datos históricos sesgados podría reducir sistemáticamente las calificaciones de ciertos grupos demográficos, lo que llevaría a la denegación injusta de préstamos u oportunidades financieras.

En esencia, los humanos siguen impulsando el ciclo de retroalimentación de la mejora en el entrenamiento de las máquinas, dando forma a cómo evoluciona y se “comporta” el modelo ML/IA.

En esta publicación, exploramos cómo los humanos generan resultados, influenciados por al menos diez factores principales interrelacionados, y cómo los modelos de ML producen resultados a través de algoritmos basados ​​en datos.

Aunque las máquinas y los humanos no obtienen resultados de la misma manera, las ideas centrales son notablemente similares.

  • Para los humanos , el proceso es intuitivo: recibimos y recopilamos información sensorial y la almacenamos en diversas formas de memoria. Nuestros procesos cognitivos combinan lógica, emociones, hormonas, experiencias pasadas, información externa del momento, etc., para producir acciones o comportamientos. Como lo ilustró Dee, esta combinación única de factores crea nuestra capacidad humana de ser predecibles y sorprendentes, racionales y emocionales, todo a la vez.
  • En el caso del aprendizaje automático o la inteligencia artificial , el flujo del proceso se basa en datos. Proporcionamos datos estructurados, semiestructurados o no estructurados, los almacenamos, los limpiamos, los etiquetamos o enriquecemos, los modelamos con algoritmos de aprendizaje automático o inteligencia artificial y, luego, dejamos que el modelo desarrollado genere predicciones, decisiones o recomendaciones. Sin embargo, como se muestra arriba, incluso este proceso aparentemente sencillo requiere una supervisión humana constante y una adaptación a nuevos escenarios.

La diferencia clave radica en la imprevisibilidad de los procesos mentales humanos, frente a la naturaleza más rastreable y parametrizada de los modelos ML/IA.

Y mientras la mayoría de nosotros nos preguntamos qué nos depara el futuro —qué pasará cuando la IA alcance la IAG y posiblemente reemplace nuestros trabajos con sus habilidades “sobrehumanas”— Dee compartió una perspectiva interesante sobre ese punto:

¿Qué pasaría si la IA comenzara a seguir nuestro camino? Desarrollaría emociones, llenaría su memoria con datos conflictivos o dañinos, crearía de algún modo una identidad y se volvería impredecible.

Hmm... No te lo esperabas, ¿verdad? — El resultado no tiene por qué ser necesariamente que la IA nos supere. — Tal vez superemos a la IA , lo que abre otra pregunta: ¿los rasgos (factores) humanos evolucionan necesariamente...? Porque tal vez ese sea el futuro de la IA.

Hasta entonces, es importante reconocer que tanto los modelos humanos como los de máquina pueden aprender, adaptarse y cambiar sus resultados a lo largo del tiempo, siempre que reciban las entradas adecuadas y la voluntad de seguir perfeccionando el proceso.

Podemos trabajar para mejorar la calidad de los resultados seleccionando mejores insumos y refinando la forma en que se procesan, ya sea en sesiones guiadas con consejeros o en diseños de datos y algoritmos de ML/IA.