4 extensiones de Chrome imprescindibles para ingenieros de machine learning y científicos de datos

03/06/2021Artículo original

Las extensiones de navegador son las armas secretas que la mayoría de los hackers y desarrolladores guardan en su arsenal para ser más productivos. Debido a que una buena parte de los estudiantes de aprendizaje automático usa Chrome (dada la enorme cuota de mercado de este navegador), he compilado una lista de extensiones de Chrome imprescindibles para ingenieros de aprendizaje automático y científicos de datos.

1.- Arxiv Vanity

Arxiv es utilizado a diario por millones de ingenieros e investigadores de la industria del aprendizaje automático para leer los artículos más recientes. Sin embargo, a menudo resulta espantoso leerlo en formato PDF. Arxiv Vanity convierte el papel en HTML para que sea fácil de leer y absorber la información.

Como puedes ver, un PDF de este tipo suele ser difícil de leer, tienes que estar forzando la vista, va en columnas por lo que hay que ir de arriba a abajo… Son algo como lo que se ve a continuación:

  3 formas de inicializar colecciones Java a la hora de declararlas

Pero se convierte en algo fácil de leer gracias a esta extensión Arxiv Vanity:

2.- Buscador de implementaciones de código para documentos ML/AI

Esta extensión del navegador te muestra automáticamente el código para cualquier trabajo de investigación sobre aprendizaje automático o inteligencia artificial que estés buscando y donde sea que lo estés mirando (Google, Twitter, Arxiv, Google Scholar, etc).

Por ejemplo, mira cómo, con esta extensión instalada, aparece automáticamente un icono de “Código” al lado de los enlaces que contienen código relacionado con un paper o artículo, en este caso llevándote directamente a GitHub:

La siguiente imagen lo muestra en acción directamente en Twitter:

3.- Abrir en Colab

Cuando estás aprendiendo machine learning muchas veces prefieres saltar directamente a la implementación del código y comenzar a experimentar. Esta extensión te permite hacer precisamente eso.

¡Simplemente busca un archivo .ipynb en cualquier repositorio de GitHub y haz clic en el ícono de la extensión!

Por ejemplo, echa un vistazo a este repositorio de GitHub que habla sobre clasificación automática de imágenes de prueba. Una vez en el archivo de la demostración, haz clic en el icono Abrir en colab en la barra de herramientas de la extensión:

  Paquetes en Java: qué son, para qué se utilizan, y cómo se usan (con vídeo)

¡Lo abrirá directamente en el entorno de Google Colab para que puedas comenzar a experimentar con él!:

4.- Instant Data Scraper

Si estás aprendiendo machine learning debes apoyarte en datos de buena calidad para entrenar a tus modelos. Esta extensión facilita mucho el proceso clave.

¡Mira esta demostración en video donde la extensión extrae todos los resultados de una búsqueda!

Un ingeniero de aprendizaje automático especializado en PNL (Procesado Natural del Lenguaje) puede usar esto, por ejemplo, para extraer reseñas y calificaciones de un sitio determinado, como Yelp. Además, también se pueden extraer comentarios y “me gusta”, lo que puede ser muy útil para quienes trabajan en el análisis de sentimiento.

Por ejemplo, la extensión puede “succionar” la lista de todos los restaurantes de tipo barbacoa en Omaha, Nebraska desde Yellowpages.com, y proporcionarte esos datos en una hoja de Excel:

  Funciones reguladoras en JavaScript: cómo limitar el número de veces que se puede llamar a una función cada segundo (throttling y debouncing)

Lo interesante de esta herramienta es que no necesita scripts especiales para analizar la página, sino que utiliza directamente análisis heurístico basado en IA para determinar la estructura y detectar datos para su extracción.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad