Definición de Inteligencia Artificial

La Inteligencia Artificial (IA) es una de las disciplinas más amplias e interesantes de la investigación científica. Científicos de diversas procedencias desarrollan su investigación en áreas de la IA. La cantidad de ramas de investigación y desarrollo es grande, sólo una parte de alguna de estas ramas puede fundamentar una vida científica.
Es una disciplina relativamente joven (sus orígenes se pueden rastrear a 1943) la cantidad de resultados logrados es impresionante, desde el triunfo de la famosa Deep Blue sobre el campeón mundial de ajedrez hasta el campeonato mundial de fútbol robot pasando por los sistemas expertos para el diagnóstico de enfermedades. Es importante destacar que no sólo se trata de comprender (como en filosofía) sino también de construir  entidades artificiales inteligentes. Es decir existen intereses científicos y de ingeniería en  IA.
Existe la idea de que todo aquello novedoso en informática es “inteligente”, carteles sobre las autopistas que anuncian el estado del tráfico, sistemas de información sobre itinerarios, etc. Naturalmente que esto se basa en la popularidad y el impacto del término, pero en muchos casos no pasan de ser simples programas de computación que no utilizan ninguna técnica de IA. Al finalizar esta unidad se estaría en condiciones de poder diferenciar auténticos sistemas de IA de otros que si bien son novedosos e importantes no están relacionados con la misma.
Antes de poder empezar a estudiar la IA es importante que podamos definir ¿qué es? En este tema no hay acuerdo completo, existen diversos enfoques. A continuación veremos algunas de las definiciones dadas por diversos autores:
  • “Inteligencia Artificial es la habilidad de las máquinas para hacer cosas que para ser hechas por humanos requieren inteligencia. La investigación en inteligencia artificial es descubrir y describir aspectos de la inteligencia humana que pueden ser simulados por máquinas” Philip C. Jackson.
  • “El estudio de las facultades mentales mediante el uso de modelos computacionales” Charniak y McDermott.
  • “La rama de las ciencias de la computación que se ocupa de la automatización de la conducta de la gente” Luger y Stubblefield.
  • “El arte de crear máquinas con capacidad de realizar funciones que realizadas por personas requieren inteligencia” Kurzweil.
  • “El estudio de cómo lograr que las computadoras realicen tareas que por el momento los humanos hacen mejor” Rich y Knight.
  • “[IA] se interesa en lograr que las computadoras hagan tareas que requieren inteligencia humana” Alison Cawsey.
Muchas tareas que para los humanos requieren el uso de inteligencia y un considerable esfuerzo, como por ejemplo realizar un cálculo matemático complejo, puede ser tremendamente simple para una computadora, mientras que otras tareas que los humanos realizan sin pensar (reconocer una cara, ver una caricatura de Bugs Bunny y saber que es un conejo, interpretar un gesto, hablar en lenguaje natural, etc.) para las computadoras son extremadamente difíciles y algunas todavía hoy no completamente logradas.
Para realizar la liquidación de sueldos al personal un persona necesita hacer uso de su inteligencia, pero no podemos decir que un sistema de sueldos sea un sistema de inteligencia artificial. Al respecto, Kvitca plantea lo siguiente  “La cuestión que la IA tiene delante de sí, en sus diversas áreas de aplicación, es cómo resolver problemas cuando no se tiene un algoritmo sistemático o directo”.  En definitiva, las definiciones de IA se pueden encuadrar en diversos enfoques ya sea se trate de imitar el pensamiento o comportamiento humano o de lograr un pensamiento o actuación racional “ideal”.
La IA si bien está fuertemente centrada en las ciencias de la computación, recibe el aporte de otras ciencias: la biología, la lingüística,  la psicología, la filosofía, etc. Las motivaciones últimas de la investigación en inteligencia artificial dependerán de cada uno, ya sean éstas comprender el funcionamiento de la inteligencia y el cerebro humano o lograr sistemas y tecnologías que nos permitan resolver problemas concretos en forma eficiente.
Si bien entonces el campo de la IA no está claramente delimitado, podemos enumerar una serie de áreas que son parte de la misma:
  • Procesamiento del lenguaje natural.
  • Inferencia.
  • Planificación.
  • Sistemas expertos.
  • Visión.
  • Robótica.
  • Redes neuronales.
Al finalizar el curso se estará en condiciones de poder definir el área de interés de estos temas,  saber cuales son sus aplicaciones y en que principios se basan.

La prueba de Turing y la sala China de Searle

 
El debate sobre si es posible o no lograr que una máquina piense aún no ha acabado y uno de los problemas es lingüístico, ya que deberíamos definir claramente que significa pensar. El diccionario dice: 
Pensar (De pienso). tr. Imaginar, discurrir, considerar – Reflexionar, examinar con cuidado – Creer, Juzgar
Si independizamos el pensar del  medio por el cual se logra, un órgano natural, entonces muchas de las cosas que llamamos pensar ya son realizadas por las computadoras.
Ahora bien ¿cómo podemos saber si estamos frente a un sistema inteligente?. Alan Turing en 1950 en “Computing Machinery and Intelligence” propuso una prueba que permitiría determinarlo. El planteaba que lo que debería preocuparnos es si es posible que una máquina pase una prueba de conducta inteligente, es decir de comportarse en forma inteligente.
La prueba consistía en poner a un humano frente a un teletipo para que dialogara con dos interlocutores: una computadora y un humano. Si no puede diferenciar cual de los dos es la computadora con un porcentaje de acierto superior al 50% y además se puede repetir el experimento con el mismo resultado sin importar las personas involucradas, entonces se habrá pasado la prueba. El dibujo muestra un esquema de la prueba de Turing . El diseño de una máquina que cumpla la prueba de Turing implica por lo menos los siguientes campos: representación del conocimiento, procesamiento del lenguaje natural, razonamiento automático y capacidad de aprender.
Podría también incorporarse lo que se llamó prueba completa de Turing, en el cual el humano pueda también pasar objetos, esto implicaría, además de lo anterior, robótica y percepción.
 
Muchas de las objeciones a la prueba de Turing  se basan en que no sólo se debería actuar inteligentemente sino ser consciente de ello. Es decir, deberíamos crear máquinas que no sólo sean inteligentes por su conducta sino que sean conscientes de ello. Turing plantea a esta cuestión: “No quiero dar la impresión de que considere que no hay ningún misterio en relación al tema de la conciencia. Pero tampoco creo que primero haya que resolver estos misterios antes de proceder a responder a la pregunta que nos ocupa en este artículo”. Es decir, Turing no intenta argumentar en el sentido de que las máquinas podrían tener conciencia. En vez de eso plantea que la pregunta es errónea. Incluso dice que en la vida cotidiana no contamos con evidencia alguna de que los otros seres humanos sean conscientes, pero “en vez de debatir interminablemente la cuestión anterior, se conviene cortésmente la consideración de que todas las personas piensan”.
En 1980 el filósofo Jhon Searle en su artículo “Minds, brains and programs”  intenta describir un sistema que puede pasar la prueba de Turing y evidentemente no entiende en absoluto lo que está haciendo (el sistema, no Searle). 
El sistema propuesto denominado la sala china se trata de una habitación donde  hay:
  • Un ser humano que sólo habla inglés. 
  • Un libro de reglas en inglés (muy grande).
  • Mucho papel en blanco y un lápiz.
La sala completamente aislada del exterior recibe por una abertura un papel escrito en chino. El humano en la sala debe ir al libro a buscar las reglas para esos símbolos y seguirlas. Como resultado puede escribir en un papel en blanco nuevos símbolos y sacarlo por la abertura. El libro de reglas debería producir respuestas adecuadas en chino a partir de preguntas hechas en chino. Visto desde afuera es un sistema que podría pasar la prueba de Turing para alguien que hable chino.
Searle argumenta: la persona en la sala no comprende el chino, los papeles y las paredes no comprenden chino, el libro en tanto que es sólo un libro no comprende de chino, no existe entonces comprensión del chino y por lo tanto la ejecución del programa no produce comprensión.
El argumento de Searle se basa en la siguiente regla:
 
Si para todo x componente de un sistema  x no tiene conciencia entonces el sistema no tiene conciencia   
 
Instanciando x en los objetos componentes de la sala china (papel, persona que no comprende chino, etc.) y s en la sala, nos da como conclusión que la sala china no tiene conciencia (si no se comprende la notación formal no importa, volveremos a ella cuando discutamos lógica de primer orden). La cuestión de fondo es demostrar la validez del segundo implica, que en el caso de papeles, libros de reglas y personas que no entienden chino parece evidente, pero supongamos que instanciamos la x en moléculas y la s en un ser humano entonces si consideramos verdadero el argumento de Searle deberíamos considerar a las moléculas como conscientes o a los seres humanos como incapaces de comprender. La refutación a Searle se basa en la falsedad de la regla anterior pero no dice nada acerca de la conciencia de la sala, es decir que puede creerse que la sala no es consciente y además rechazar la argumentación de Searle.
Posteriormente en su libro “The Rediscovery of the Mind” de 1992 Searle actualiza su postura y presenta a la conciencia como una propiedad emergente de determinada organización de un sistema neuronal. Esta afirmación es aceptada aún por sus críticos. Pero el problema es determinar cuales son las propiedades del sistema neuronal que determinan la conciencia. Searle admite que pueden existir otros medios físicos, aparte de las neuronas, que puedan generar conciencia. Pero dice que es determinado por las propiedades físicas del mismo y no por el programa que se ejecutará. Es decir, la clave pasa por la diferencia entre las propiedades intrínsecas y las funcionales o extrínsecas del medio (ejemplo: una neurona). Para determinar de donde proviene la conciencia no puede basarse sólo en la intuición, se debe ver si realmente es una propiedad intrínseca o si es funcional. Es decir habría que comprobarlo.
De todas formas uno de los objetivos más claros de la IA es la de producir agentes inteligentes que asistan a los humanos compensando las limitaciones de éstos. Esto evidentemente provee un beneficio práctico del cual ya se podría disfrutar.
 

 

El origen del término Inteligencia Artificial se debe a Jhon McCarthy que en el verano de 1956 organizó un taller en Dartmouth College, donde se juntaron un grupo de importantes investigadores, entre otros: Minsky, Rochester, Shanon, Solomof , Selfridge (estos últimos de MIT) y de Carnegie Tech (actualmente Carnegie Mellon Univeristy) a Allen Newell y Hebert Simon (posteriormente premio Nobel).  Uno de los acontecimientos más interesantes de dicho taller fue la presentación por la gente de Carnegie Tech del “The Logic Theorist”. Este programa era capaz de demostrar varios teoremas de “Principia Mathematica” de Russel y Witehead.  Pero el primer trabajo reconocido es el de McCulloch y Pitts que en 1943 propusieron un modelo de redes neuronales. 
Los primeros años de la inteligencia artificial fueron épocas de grandes éxitos y notables logros. En 1957 Hebert Simon dijo:
“Sin  animo de sorprenderlos y dejarlos atónitos, debo informarles lisa y llanamente que actualmente en el mundo existen máquinas capaces de pensar, aprender y crear”
Newell, Shaw, y Simon crean GPS (General Problem Solver) Solucionador General de Problemas en 1957. Uno de los aportes de este modelo se basa en la idea de distinguir el conocimiento del problema de la forma de resolver el mismo, es decir separar conocimiento y control.
Sin embargo, las herramientas de programación eran bastante rudimentarias hasta que en 1958 McCarthy introduce el lenguaje LISP. Este es el segundo lenguaje de alto nivel más antiguo (el primero fue Fortran) y que aún en la actualidad es usado (en sus variantes modernas como Common Lisp).
En la década del 1970 surge otro lenguaje fundamental en la inteligencia artificial el PROLOG (PROGraming in LOGic). Este se basa en el cálculo de predicados de primer orden y en el principio de resolución de Robinson (que veremos más adelante).
En 1969 en un libro de Minsky y papera, “Perceptrons”, se demuestra que la capacidad de representación de un perceptron es limitada, marcando el comienzo del abandono de los científicos de la computación de la investigación en el área de las redes neuronales por un largo tiempo. El interés por las redes neuronales permaneció abandonado hasta la década de 1980. Sin embargo alguna investigación en el tema de las redes neuronales se mantuvo viva mediante la investigación de científicos de otras ciencias como la física (Hopfield) y la psicología (donde Rumelhart y Hinton estudian los modelos de memoria basados en redes neuronales).
En el período de 1969 hasta 1980, el interés predominante eran los sistemas basados en conocimiento, que planteaban una visión distinta a la de los primeros años de investigación, donde se buscaban programas que resolvieran problemas en general (como el GPS) es decir simular el razonamiento (independiente del dominio) para encontrar soluciones (estos métodos son denominados débiles). Los sistemas basados en conocimiento, de los cuales los más conocidos son los sistemas expertos, se basan fundamentalmente en incorporar conocimiento específico del dominio sobre el cual se monta un motor de inferencia. La forma de representar este conocimiento es principalmente en un principio reglas del tipo “Si...entonces...”  (Si llueve entonces me mojo). La idea era que para resolver problemas era más importante el conocimiento específico de un experto que la inteligencia. Si a A. Einsten se le descomponía el auto sería difícil que hubiera podido arreglarlo ya que a pesar de su inteligencia no cuenta con el conocimiento del dominio (mecánica automotriz) necesario, por lo cual recurre a un experto (mecánico) para solucionar el problema (aunque con Einsten nunca se sabe).
Uno de los éxitos más resonantes y paradigmáticos fue el programa MYCIN que era un sistema experto (originalmente con 450 reglas) que permitía diagnosticar infecciones sanguíneas. El porcentaje de aciertos de MYCIN superaba a la media de los médicos y alcanzaba la de un experto. En 1987 ya existían alrededor de 1900 Sistemas Expertos en el mundo. 
A finales de los años ochenta se trabajaba mucho sobre la comprensión del lenguaje natural. En 1973 Willam Woods creó una interfaz para geología llamado LUNAR, que permitía hacer preguntas en inglés sobre muestras de rocas traídas por el Apolo 11.
Para fines de la década de 1980 las compañías más importantes de Estados Unidos, con DEC (Digital Equipament Corporation) a la cabeza, contaban con grupos de inteligencia artificial.
HITECH, un programa que jugaba al Ajedrez, derrota al gran maestro internacional Arnold Denker en 1989. Kasparov, el campeón mundial de ajedrez juega en  febrero 1996 contra Deep Blue de IBM (Big Blue) y gana 4 a 2, pero en Mayo de 1997 Deep Blue derrota al campeón mundial por 3.5 a 2.5 siendo la primera vez que una máquina derrota a un campeón mundial.
Una nueva rama interdisciplinaria, la Bioinformática o Biología Computacional utiliza, junto a otras, técnicas y herramientas surgidas de la IA para resolver problemas biológicos, como el secuenciamiento de ADN.