Tal como figura en su web oficial en palabras textuales, se trata de la plataforma ‘Data Science’ Python/R más popular del mundo. Disponible para Linux, Windows y Mac OS X.
Es software libre, y es el IDE principal recomendado por QE2c. Se instala en el directorio /home, lo que nos evitará problemas de permisos.
Apropiado para Data Science, Machine Learning, Deep Learning y, en general, disciplinas de la IA (Inteligencia artificial).
Existe una versión menor de Anaconda, llamada Miniconda, que podemos usar en caso de una conexión lenta o poco espacio en disco.
Anaconda nos permite fácilmente la creación de entornos virtuales Python, así como la instalación de paquetes, entre ellos los especializados en Data Science y Deep Learning.
| Documentación de Anaconda Individual Edition |
Tabla de contenidos
Anaconda, instalación y primeros pasos
Instalación de Anaconda
Dirigirse al sitio de descarga de Anaconda, seleccionar el sistema y tipo de equipo oportuno y seguir las instrucciones de instalación. Para usuarios que deseen la distribución libre y gratuita deben instalar la versión Anaconda Individual Edition.
Instalar siempre la versión de Python 3.X (3.7 en el momento de redactar este escrito), salvo que exista un motivo especial para necesitar la versión 2.
Antes de la instalación, conviene observar las dependencias para poder usar paquetes GUI, que en el caso de distros basadas en Debian, es el siguiente:
sudo apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6
Instalar Anaconda:
bash ~/ruta_al_instalador/Anaconda3-2020.02-Linux-x86_64.sh
…donde debe sustituirse: ‘/ruta_al_instalador/’ por la ruta en la que esté el fichero, a partir de /home; y ‘Anaconda2-2019.10-Linux-x86_64.sh’ por el auténtico nombre de fichero instalador. A partir de ahí la instalación no presenta mayores dificultades.
Una vez instalado, saltar a «Empezar con Anaconda«.
Después de instalar Anaconda o Miniconda, usaremos estos dos:
- Navigator, GUI (interfaz gráfica). Nos permite ejecutar aplicaciones, administrar paquetes, entornos, sin necesidad de escribir comandos.
- Conda. Funciona en el terminal de comandos.
Podemos cambiar entre ambos conservando el trabajo realizado.
Para abrir el navegador: En el terminal de comandos, y desde el entorno ‘base’ se abre por defecto, insertar:
anaconda-navigator
Conda, comandos de interés
Pero Conda es mucho más, es un administrador de paquetes para administrar el entorno virtual e instalar paquetes. A continuación se describen diferentes comandos de Conda de especial interés.
Si no queremos que el entorno base de Conda se active al arrancar nuestro sistema, podemos cambiar el parámetro auto_activate_base a falso:
conda config --set auto_activate_base false
Actualizar Conda en nuestro entorno virtual:
$ conda upgrade conda $ conda upgrade --all
Crear un nuevo entorno con Conda:
$ conda create -n [nombre_del_entorno] $ conda cerate -n [nombre_del_entorno] python=[python-version]
Activar o desactivar un entorno virtual, respectivamente. Nota: es también posible usar el comando ‘source’, aunque actualmente la documentación oficial indica el uso de ‘conda’:
$ conda activate nombre_del_entorno $ conda deactivate
Echar un ojo al entorno que hemos creado
$ conda info $ conda list
Instalar un paquete con Conda y verificar que se ha instalado (en el ejemplo, numpy)
$ conda install numpy $ conda list
Verificar los entornos que tenemos actualmente con una de las dos opciones:
$ conda info -e $ conda info --envs
Eliminar un entorno
$ conda env remove --name [my-env-name]
Instalación de paquetes con Conda o Pip
Ambos son software libre y podemos usar ambos para la instalación en un entorno virtual creado con Conda. Las diferencias: conda instala cualquier paquete. pip instala solo paquetes python, es el administrador de paquetes por defecto de Python. Podemos usar conda list para verificar la list a de paquetes, y si estos están instalados con conda o pip.
Para usar Conda, es altamente recomendable contar con el «conda cheat sheet» (hoja de trucos).
Empezar con Conda
La doc. oficial nos recomienda mantener Conda a su versión más actualizada. Por tanto, comprobamos e instalamos, si existe nueva versión:
conda update conda
Empezamos Anaconda o Conda con el entorno predeterminado ‘base’. Sin embargo no es deseable instalar paquetes en este. Creamos entornos diferentes para mantener nuestros programas aislados entre ellos. Esta es la finalidad de los entornos virtuales. Creamos a continuación el entorno llamado serpentdream e instalamos el paquete BioPython:
conda create --name serpentdream biopython
El entrono estará disponible también desde el entorno gráfico (navegador Anaconda).
Necesitamos activar el nuevo entorno para trabajar dentro de él:
conda activate serpentdream
Verifica que versión de Python está usando el entorno:
python --version
En caso de ser necesario, cambiamos la versión de Python que usa Conda (a no ser que existas restricciones, usaremos siempre Python3):
conda install python=3.7.4
3.7.4 es la última versión en el momento de este escrito. Sustituir por la versión que proceda.
Desactivar el entorno actual y volver al entorno base:
conda activate
Más sobre el uso de conda en la doc. oficial [conda.io].
Actualizar Anaconda
Para actualizar la distribución completa:
conda update anaconda
Actualizar la biblioteca scikit-learn
Actualizamos la biblioteca más usada para Machine Learning en python, SciKit Learn
conda update scikit-learn
Instalar paquetes Conda
Podemos instalar paquetes desde la interfaz gráfica (Anaconda Navigator) con solo unos pocos clics. Para ello, en Anaconda Navigator, seleccionar la pestaña ‘Environments’ en la columna izquierda, y utilizar el campo del buscador de paquetes «Searh Packages».
Ttambién podemos instalar desde el terminal de comandos:
conda install [nombre-del-paquete]
Jupyter Notebook
El Jupyter notebook, anteriormente llamado iPython, es un paquete de software libre incluido con la instalación Anaconda, (esta incluye además de otros cientos de paquetes libres).
es el más popular de los llamados «entornos Notebook». Su multitud de características de ayuda a los desarrolladores, posibilidad de escribir el código en celdas separadas, … hacen de este Notebook una buena opción para aprender.
Jupyter es muy recomendable para realizar sesiones interactivas, en lugar de la consola tradicional. Cuenta con herramientas adicionales interesantes, como el autocompletado, que se lanza pulsando el tabulador, o el operador ?, que muestra información sobre cualquier objeto añadiendo ? al final del nombre del objeto.
Enlaces de interés
Tutorial Jupyter para principiantes. Un buen lugar para empezar. [fullstackpython.com] Multitud de recursos para formarse en Jupyte.
Sobre Atom y Anaconda
Atom es un increíble editor de texto para programación. Este puede coexistir con Anaconda, complementándolo. Ver: Installing Python, Anaconda and Atom.
Instalación de TensorFlow y Keras, para el estudio de Machine Learning
TensorFlow es una plataforma software libre de extremo a extremo para el Machine Learning (aprendizaje automático). Cuenta con herramientas, bibliotecas y recursos comunitarios.
No es necesario disponer de Anaconda para instalar y usar TensorFlow, si bien Anaconda facilita su instalación.
Ya no es necesario instalar Keras separadamente. Ahora es parte de TensorFlow. Existen dos formas de instalar TensorFlow:
- De forma nativa con ‘pip’ o desde el código.
- Instalación en un entorno virtual con Virtualenv, Anaconda o Docker.
El Jupyter notebook, si bien no necesario para el uso de TensorFlow, es recomendable para principiantes que se incian en Deep Learning o Machine Learning.
A continuación, la instalación de TensorFlow nativa con conda, tal como muestra la página de la documentación de Anaconda.
Instalación de la versión actual de Tensorflow, solo CPU (recomendada para principiantes):
$ conda create -n tf tensorflow
$ conda activate tf
o bien instalar la versión actual GPU:
$conda create -n tf-gpu tensorflow-gpu
conda activate tf-gpu
Instalación alternativa de Tensorflow en un entorno virtual usando ‘pip’ en vez de ‘conda’:
# Instalamos y/o actualizamos pip en el entorno virtual $ conda install pip # Instalamos Tensorflow version CPU pip3 install --upgrade tensorflow Verificamos la correcta instalación de TensorFlow: # invocamos el intérprete Python: $ python3 # creamos un programa python simple, estando en modo interactivo: >>> import tensorflow as tf >>> hola = tf.constant('hola TensorFlow') >>> sesion = tf.Session() # Salimos del intérprete Python: Ctrl+D
Existe la posibilidad alternativa de usar TensorFlow en la nube, directamente en el navegador con Google Colab, un entorno gratuito de Jupyter Notebook que no requiere configuración. Ver el tutorial de medium.com.
Bibliografía y enlaces de interés
[medium.com] Anaconda, Jupyter Notebook, TensorFlow and Keras for Deep Learning. Buena introducción a Anaconda, Tensorflow y Jupyter, por Margaret Maynard-Reid
[conda.io] Getting started with Conda. Documentación oficial de Anaconda.
[tensorflow.org] Raíz del sitio oficial de Tensorflow.
Deja una respuesta