IA, Deep Learning, Machine Learning, Ciencia del dato y BigData

En este artículo se repasarán en qué consisten cada una de estas tecnologías y de dónde proceden

Posted by David Solís on Febrero 19, 2019

¿Qué es la Inteligencia Artificial (IA)?


Se han dado muchas definiciones de IA a lo largo de la historia. Mejor que repasar esas definiciones, vamos a descartar lo que no es. Mucha gente, en especial ajena a este mundo, suele pensar erróneamente, y en gran parte gracias al cine de ciencia ficción, que la IA es robótica futurista. A pesar de que Arnold Schwarzenegger tiene un cociente intelectual muy alto su inteligencia no se puede considerar artificial.

Aunque la IA no es solamente robótica futurista los humanos llevamos siglos soñando con esta posiblidad. Ya en la antigua Grecia se contaban historias sobre un hombre mecánico diseñado para imitar el comportamiento de una persona. Por otro lado, las primeras máquinas fueron concebidas como máquinas lógicas. Y este no es un hecho fortuito. Esas máquinas lógicas pretendían reproducir la memoria y la capacidad aritmética que únicamente los seres humanos poseemos. No era más que un intento de reproducir artificialmente un cerebro humano.

De la mano de la evolución tecnológica y de nuestro propio conocimiento acerca del funcionamiento de nuestra mente, el concepto de lo que consideramos inteligencia artificial también ha cambiado. En sus inicios la IA se centraba en aprender tareas que podían ser especialmente complejas para los seres humanos, pero por contra, "sencillas" para una máquina. Eran tareas que requerían una gran cantidad de cálculos, o que estaban centradas en jugar a determinados juegos como las Damas, el Ajedrez o el Go. Actualmente la IA está más centrada en conseguir lo que para los humanos es trivial, pero esencial para sobrevivir en la sociedad: comprender, reconocer lo que se ve, comunicarse coherentemente, conducir un vehículo, etc.

Para llegar hasta donde estamos actualmente ha sido necesario que se den varios hitos conjuntamente:

  • El poder de procesamiento ha mejorado de una manera impresionante. Se ha producido un aumento multiplicado por trillones del rendimiento a lo largo de los últimos 60 años.
  • El coste del procesamiento de datos se ha vuelto más asequible.
  • Se tienen disponibles una cantidad de datos ingente, que se han ido recolectando durante años.

Taxonomía

Como hemos  visto, el objetivo principal que siempre ha perseguido la IA es que las máquinas  “piensen y actúen como los seres humanos”; o dicho de otra forma, que puedan realizar tareas como: razonar, planificar, generar nuevo conocimiento, entender el lenguaje y percibir el entorno que le rodea. Nadie espera que en la actualidad, o en un futuro cercano, una tecnología pueda igualar la inteligencia humana, pero el objetivo es que una máquina sea capaz de alcanzar la inteligencia generalizada, es decir, aglutinar todas esas capacidades junto con capacidades totalmente humanas como son la moral o creatividad.

Aún no habiendo alcanzado tal objetivo la IA tiene grandes implicaciones en la forma en que vivimos nuestras vidas a nivel individual y se está convirtiendo en algo esencial para todas las empresas.

Machine Learning

Dentro del campo de la IA existen varios subcampos: la optimización metaheurística, los sistemas expertos, la inferencia automática, etc. Pero el  más importante hoy en día es el denominado Machine Learning (ML) o en castellano Aprendizaje Automático. El aprendizaje automático es la aplicación de la IA basada alrededor de la idea la máquinas pueden aprender de la experiencia. La experiencia en la mayoría de los casos se traslada a los datos.

Dentro del grupo del aprendizaje automático tenemos múltiples algoritmos que se han desarrollado tras muchos años de investigación, prácticamente ninguno de ellos se han inventado en los últimos años. Recordamos que el aprendizaje automático se empieza a dar en los 50s.

Deep Learning

Un subgrupo de estos algoritmos son especialmente importante hoy en día. Son los correspondientes al campo de las redes neuronales, aunque hoy en día se habla más de Deep Learning (DL, aprendizaje profundo), una especialización de la redes. De nuevo estas redes, intentan imitar la estructura de las redes neuronales cerebrales y de lo que conocemos de su funcionamiento.


 

¿Que diferencia a DL de las redes neuronales clásicas? Muchos pensarán que son simplemente más grandes (deep), pero lo que realmente las define es que explotan ciertas estructuras que se encuentran en imágenes, textos, sonidos o series temporales.

De nuevo, ni las redes ni el DL es algo que se haya inventado hace pocos años. Las redes son una invención de los años 80 y las técnicas de deep learning de finales de los 90, pero hemos necesitado de cierta evolución tecnológica a nivel de hardware para conseguir que estas técnicas sean realmente útiles. De hecho, como anécdota, en los años 90 se produjo una de las decadencias del aprendizaje automático debido a que los algoritmos no parecían ser capaces de ser aplicados a problemas reales. El motivo no era otro que, con la capacidad computacional disponible en aquel momento, eran necesarios meses o años para que un algoritmo llegara a obtener resultados aceptables. Evidentemente los investigadores no podían esperar tal cantidad de tiempo y la comunidad científica abandonó en su mayoría dicha rama para centrarse en otras técnicas centradas en reglas e inferencia.

Ciencia del dato

Ahora que tenemos una idea de qué es la IA, el ML y el DL, podemos definir qué es la ciencia del dato (CD, o en inglés DS, de Data Science). La CD es un campo interdisciplinario que toma lo mejor o más útil de la IA, del ML y del DL para  extraer conocimiento y generar valor a partir de los datos que se pueden presentar en diversos formatos y provenir de múltiples fuentes. Pero la ciencia del dato no se queda solamente ahí. También es necesario hacer uso de bases de datos no relacionales o columnares, extraer información pública de internet, conciliar datos de diferentes fuentes y realizar visualizaciones para entender la información o para presentar resultados. Para todo ello además hace falta unos sólidos conocimiento de matemáticas, estadística y probabilidad además de programación. ¡Ahí es nada!

Encontrar una persona que atesore todas estas habilidades o conocimientos no es fácil. Se necesitan años de estudio y asimilación para poder llegar a ser un verdadero científico de datos. Es por este motivo que a los verdaderos científicos de datos se les denomina unicornios (difíciles de encontrar, pocas personas reconocen haber coincidido con alguno).

Big Data

Ya sólo nos queda definir que es big data, pero lo vamos a dejar para otra entrada de este blog. Pero no puedo terminar sin darte un consejo: Si alguien te dice que necesitas un modelo de big data para predecir algo ten claro que no sabe mucho del tema o te intenta vender algo que no necesitas.