4 min. de lectura

 

La inteligencia artificial (IA) es una de las tecnologías más comentadas hoy en día y que plantea muchas interrogantes, pero, ¿qué significa realmente el término?

Primeramente, hay que aclarar que no existe “una” inteligencia artificial. La inteligencia artificial es todo un campo, un cúmulo de tecnologías que «razonan» o «actúan» de forma «racional» o «similar al ser humano».

Y aquí tenemos 4 posibles definiciones según combinemos alguna opción de «razona » o «actúa» con «racional » o «similar al ser humano».

Vale la pena diferenciar estos dos últimos términos y aclararlos: i) definimos como racional aquello que «razona»/«actúa» de forma eficiente en relación a objetivos y recursos ii) el ser humano no necesariamente es racional todo el tiempo [1].

Si te sientes estafado porque aún no entiendes que hay detrás de toda esa “magia”, podemos replantear la pregunta: ¿Cómo funcionan estas IA? ¿Qué hay dentro de la caja negra?

Obviamente, con este artículo no serás capaz de construir robots que se mueven de forma natural o sistemas que respondan preguntas complejas, pero trataremos de transformar esos grandes problemas en más pequeños, manteniendo su esencia.

Para crear un sistema inteligente se utilizan principalmente tres enfoques transversales:

  1. La lógica.
  2. Heurísticas de búsqueda.
  3. Aprendizaje automático.

Enfoque basado en lógica

Se trata de aplicar reglas de forma automatizada sobre las consultas o entradas que enviemos al sistema. Por ejemplo, si programo un sistema con la regla “Si A es adulto, entonces A está cansado” y luego cargamos al sistema que Juan es adulto, el sistema debe dar como resultado automático que Juan está cansado.

La tecnología conocida como “sistemas expertos” es una de las primeras aplicaciones comerciales de la IA hace varias décadas ya, y se basa principalmente en la carga de tales reglas obtenidas a partir de conocimiento humano experto.

Existen varios tipos de lógica con diferentes grados de abstracción, y con una carga de suficientes reglas se pueden construir sistemas relativamente complejos [2].

Heurísticas de búsqueda

Supongamos que tenemos un problema de decisión donde intentamos encontrar el camino más corto de un punto a otro, el mueble que más agradaría a un cliente, maximizar la producción de un producto en función a recursos limitados, etc. Todos esos son problemas que se pueden codificar en secuencias de ceros y unos para probar distintas configuraciones a ser evaluadas posteriormente: generar posibles caminos, posibles muebles, posibles planificaciones de recursos, etc.

A esas configuraciones las llamamos soluciones posibles, donde el problema es buscar una solución óptima o suficientemente buena. En algunos casos, esa evaluación es completamente transparente —como encontrar el camino más corto— y otras completamente opaca —como satisfacer el gusto del cliente— pero, en esencia, ambos son problemas de búsqueda.

Cuando el problema es suficientemente complejo u opaco, solo son aplicables abordajes de IA. Por ejemplo, el abordaje evolutivo consiste en combinar las soluciones de forma aleatoria con tendencia a elegir a las mejores de forma iterativa (o de generación en generación), de modo a simular la optimización producida por la selección natural [3]. Sin embargo, se han propuesto muchas otras heurísticas inspiradas en la naturaleza; incluso hay una inspirada en la forma que la COVID-19 se esparce, buscando posibles soluciones como el virus busca a sus víctimas en la población [4].

Aprendizaje de máquina

Los chatbots ya han llegado hasta a la medicina (Imagen: News Medical).

Este es el abordaje más complejo y que ha dado los resultados más acelerados de forma reciente. Este campo también se considera parte de la ciencia de datos, porque básicamente busca desarrollar sistemas que aprenden de forma automática a partir de los datos, a diferencia de los demás abordajes que implican el diseño del conocimiento en el sistema por parte de los humanos.

¿Pero qué aprenden exactamente? Primeramente, observemos que los objetos de un mismo tipo pueden ser descritos con atributos similares:

  • Las personas por su altura, peso, nacionalidad, profesión, etc.
  • Comentarios en las redes por las palabras que aparecen, donde la aparición de una palabra es un atributo binario (aparece o no aparece).
  • Imágenes del mismo tamaño por sus píxeles, donde la intensidad de cada píxel es un atributo.

Limitando la cantidad de atributos obtenemos una función de probabilidad a partir del conjunto de objetos. Por ejemplo, la probabilidad de que una persona mida más de 1,70 m, pese más de 60 kg, sea nepalés y piloto es 1/5.000.000. Básicamente, los modelos de aprendizaje de máquina tratan de aprender cualidades de la distribución de probabilidad de una población a partir de una muestra llamada conjunto de datos.

Existen dos formas de aprendizaje a partir de una distribución de probabilidad [5]:

  1. Modelos discriminativos: aprenden una única propiedad a partir de los datos de modo a etiquetar a cada ejemplo nuevo de la población con el valor más probable de tal propiedad.
  2. Modelos generativos: aprenden la función de probabilidad en sí, de modo a que si le asignamos valores a unos pocos atributos, el modelo asigna los valores más probables a los demás atributos, “generando” un nuevo ejemplo.

Pero también podemos clasificar al aprendizaje de máquina por la manera en que aprende [6]:

  1. Aprendizaje supervisado: dar etiquetas a cada ejemplo, de modo que el modelo aprenda a predecir la etiqueta correcta en ejemplos nuevos. Por ejemplo, a partir de fotos de gatos y perros con la etiqueta “gato” y “perro” para que el modelo sepa, al encontrarse con fotos nuevas, cuando es gato o perro.
  2. Aprendizaje no supervisado: que el modelo invente sus propias etiquetas a partir de datos no etiquetados. Por ejemplo, que el modelo separe por sí mismo fotos de gatos y perros en clases separadas a pesar de no saber qué es un gato o un perro.
  3. Aprendizaje por refuerzo: se aplica a problemas donde queremos que el modelo se comporte de determinada manera por medio de “premios” y “castigos” en función a objetivos. Por ejemplo, un sistema que compra y vende acciones al que se le premia cuando gana dinero y se le castiga cuando pierde.

Si lo notan, mencionamos mucho la palabra “modelo”. Un modelo de aprendizaje de máquina es como una fórmula matemática que depende de varios valores (a, b, c, d, etc.) que se ajustan a los datos de modo a obtener los resultados esperados. Parece un reduccionismo extremo, pero dependiendo de la fórmula y 100 billones de valores que ajustar, obtienes un ChatGPT 4, que es un sistema generativo no supervisado [7].

Alfabetización en IA

Este fue un intento de sintetizar a la IA en pocas líneas, pero hay una buena noticia para aquellos que quieran saber más del tema y sus aplicaciones. Hay varias ofertas académicas en Paraguay, entre ellas las de Ciencia del Sur y de la Facultad Politécnica de la Universidad Nacional de Asunción (FP-UNA).

La FP-UNA ofrece actualmente un diplomado a distancia que está dirigido a la aplicación de IA al sector productivo y que no es exclusivo para informáticos. El Diplomado en Inteligencia Artificial Aplicada a Productos y Servicios se enfoca en la IA para la analítica de negocios, visión artificial y procesamiento del lenguaje natural.

Por su parte, Ciencia del Sur ofrece un Taller de Invierno de Escritura Científica que abordará el uso de la inteligencia artificial en la redacción de artículos académicos.

Finalmente, podemos cerrar este artículo con la reflexión de que sin duda la IA implica riesgos de todo tipo, pero la mejor forma de lidiar con ellos es encarándolos con el conocimiento.

Bibliografía

  1.  Russell, Stuart J. Artificial intelligence a modern approach. Pearson Education, Inc., 2010.
  2. Genesereth, Michael R., and Nils J. Nilsson. Logical foundations of artificial intelligence. Morgan Kaufmann, 2012.
  3. Yu, Xinjie, and Mitsuo Gen. Introduction to evolutionary algorithms. Springer Science & Business Media, 2010.
  4. Martínez-Álvarez, Francisco, et al. «Coronavirus optimization algorithm: a bioinspired metaheuristic based on the COVID-19 propagation model.» Big data 8.4 (2020): 308-322.
  5. Zhou, Zhi-Hua. Machine learning. Springer Nature, 2021.
  6. Bernardo, J. M., et al. «Generative or discriminative? getting the best of both worlds.» Bayesian statistics 8.3 (2007): 3-24.
  7. SSCNR. «Chat gpt 4 parameters, How to use GPT 4, chat gpt 4 features, Login and more.» Sscnr, sscnr, June 17, 2023, https://sscnr.net.in/chat-gpt-4-parameters/.

¿Qué te pareció este artículo?

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (3 votos, promedio: 5,00 de 5)

Sebastián Alberto Grillo es licenciado en matemática pura y máster en ciencias de la computación por la Universidad Nacional de Asunción (UNA). Es doctor en ciencias de la computación por la Universidad Federal de Río de Janeiro, Brasil. Investigador en matemática aplicada, computación teórica e inteligencia artificial. Está categorizado en el PRONII nivel I del CONACYT. En Ciencia del Sur es columnista de matemática, ciencias de la computación y educación.

Compartir artículo:

1 COMENTARIO

  1. Interesante, pero muy genérico. Para información general muy bueno. Será necesario profundizar sobre la naturaleza de inteligencia artificial.

Dejar un comentario

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí