En primer lugar, un proyecto de IA, debe definir lo más exactamente posible, lo que desea lograr:
Los programas que se enmarcan en el primer caso, tratan de modelar el comportamiento humano, para ejecutar las siguientes tareas:
En el segundo caso, están agrupados los programas de IA de índole más práctica, que sin ser rigurosos en la modelación del comportamiento humano, tratan de proporcionar soluciones aceptables.
Cada campo necesita criterios para evaluar el éxito alcanzado. En general, es muy difícil determinar si una máquina o un sistema tiene inteligencia o puede pensar. Al respecto se han sugerido algunas pruebas entre las que se destaca la de Alan Turing (1912-1954). En 1950 ideó una prueba para reconocer comportamientos inteligentes, esta prueba dice lo siguiente:
Si la ejecución de un sistema de IA puede convencernos de que su comportamiento es el que tendría un humano, entonces el sistema es verdaderamente inteligente.
En una forma más práctica, para saber si un trabajo de investigación en IA ha tenido éxito, debe hacerse tres preguntas claves:
¿Está definida con claridad la
tarea?
¿Existe un procedimiento ya
instrumentado que efectúe la tarea? Si no existe, es que deben haber muchas dificultades
escondidas en algún lugar.
¿Existe un conjunto de
regularidades o restricciones identificables a partir de las cuales el procedimiento
implantado obtiene su validez? De no ser así, el procedimiento no pasaría de ser un
juguete, tal vez capaz de un desempeño superficial impresionante en ciertos ejemplos
seleccionados con cuidado, pero incapaz de impresionar con un desempeño profundo y de
resolver problemas más generales.
Para determinar si una aplicación de IA ha tenido éxito, deben plantearse preguntas adicionales como las siguientes:
Eventualmente, las respuestas a las preguntas planteadas, deberán ser complementadas con pruebas típicas de verificación y validación de sistemas: eficacia en el desempeño, eficiencia operativa, facilidad de uso, flexibilidad, portabilidad, etc.