Ganar nuestro primer concurso de datos: nuestras 4 conclusiones

Las máquinas aprenden, y Mutters también

October 5, 2022
Empresa

Un poco de contexto sobre la competencia

Cada año, la facultad de Ciencias Naturales y Exactas de la Universidad de Buenos Aires organiza el Escuela de Ciencias Informáticas También conocido como «ECI». Desde su propia página,

El objetivo de ECI es ofrecer a los estudiantes y profesionales de Ciencias de la Computación cursos intensivos de alto nivel sobre temas no cubiertos por los planes de estudio regulares. Estos cursos son impartidos por profesores de universidades e instituciones de todo el mundo, lo que permite a los participantes de las escuelas establecer vínculos para la cooperación académica, así como promover las actividades de investigación y desarrollo.

Por lo general, hay uno o dos concursos organizados en MetaData que se incluyen en las actividades de la ECI y patrocinados por un socio. Este año, Alix Partners patrocinó el Series temporales en Hopp competencia. El objetivo era predecir los pagos del capital de varios préstamos, teniendo en cuenta la información histórica.

¿Por qué esta competencia de datos?

En esta ocasión, Muttdata fue un Socio de oro, y qué mejor manera de ser parte del evento que participar trabajando en lo que mejor sabemos: los datos.

En segundo lugar, ya sea HOPP o cualquier otro concurso o evento de datos, buscamos activamente oportunidades para conocernos, ya que puede ser un desafío para un empresa asíncrona que prioriza el control remoto.

Por último, pero no por ello menos importante, HOPP era la opción perfecta para nuestro equipo. La competencia tenía una barrera de entrada baja, un planteamiento de problemas bien definido y una gran comunidad local a su alrededor. Además, teníamos poco más de un mes, lo que hizo que fuera breve y directo.

Nuestro viaje

En 2020, creé un canal de Slack llamado #kaggle -metadata para hacer un seguimiento y organizar un equipo para que participara en los desafíos de aprendizaje automático de Kaggle. Con pocos miembros, algunos enlaces como contenido principal del canal y la falta de reuniones de seguimiento, no tardó mucho en desaparecer. No fue hasta 2022 que renovamos el espacio de forma proactiva para que comenzara correctamente. Esta vez, con los procesos y un plan adecuado en marcha.

Concursos de ML fue excelente para ayudarnos a organizar las competiciones en curso. No solo incluía los concursos de Kaggle, sino también varios otros de los que no habríamos oído hablar de otro modo. Aquellos de nosotros con más experiencia en competiciones de aprendizaje automático ayudaríamos a evaluar las competiciones en función de sus objetivos, datos, complejidades y plazos.

Una vez que elegimos nuestra primera competición, los detalles operativos fueron sencillos: seleccionar equipos, crear repositorios y canales privados de Slack para evitar infringir las reglas de la competencia y permitir que cada equipo se autoorganizara. Cada dos semanas, nos reuníamos para hablar sobre los avances, los obstáculos, los problemas, los aprendizajes, la incorporación de nuevos murmullos interesados y los pasos a seguir.

Conclusiones clave

Nuestra experiencia preparándonos como equipo y la competición en sí nos dejaron las siguientes conclusiones.

1) ¡Haga que el aprendizaje sea divertido!

En publicaciones anteriores, mencionamos nuestro proceso de incorporación y el horario de oficina de datos como dos momentos de aprendizaje en Muttdata. ¿Qué es lo que lo une todo? ¿Qué impulsa el aprendizaje en Muttdata? Pensamos que podríamos responder a esa pregunta con dos citas de Isaac Asimov:

Cita 1) Ese es otro problema con la educación tal como la tenemos ahora. La gente piensa que la educación es algo que pueden terminar. Y lo que es más, cuando terminan, es un rito de iniciación.

En Muttdata creemos en el aprendizaje como un proceso continuo. No importa su título o sus años de experiencia en la industria, siempre hay algo que aprender.

Cita 2) El problema del aprendizaje es que la mayoría de las personas no lo disfrutan debido a las circunstancias. Haga posible que disfruten aprendiendo y seguirán así.

En Muttdata, buscamos experiencias como HOPP que puedan hacer que el aprendizaje sea divertido. Cuando las personas están realmente interesadas e invierten en las actividades es cuando más aprenden. Esto fue visible en la energía que estuvo presente durante esta competencia. A veces, nuestras tareas diarias no son tan atractivas como nos gustaría que fueran. Los concursos de datos nos enseñan que, si este es el caso, siempre podemos salir y buscar diferentes espacios de aprendizaje.

2) Elige tus batallas

¿Cuál es el propósito de nuestro grupo de competiciones? Crear un espacio seguro sin plazos para los clientes, sin preocupaciones de mantenimiento o de cara al futuro. Un lugar donde el equipo pueda practicar lo que quiera practicar. Crear un patio de recreo para el aprendizaje.

Liderar la iniciativa significa planificar y seleccionar cuidadosamente las competiciones que sean útiles e interesantes para todos.

Antes de HOPP, empezamos con la competencia de datos de la Bolsa de Valores de Japón. Solo para darnos cuenta de que no era posible ver qué tan bien nos iba y no podíamos comparar nuestros resultados con los de la competencia. La posibilidad de comparar nuestro trabajo, aprender y mejorar es imprescindible para nosotros.

3) La transferencia de conocimiento es el premio

Los premios fueron un gran reconocimiento, pero no nuestro objetivo. Tras la competición, pedimos a cada murmurador que preparara un resumen de 15 minutos con la predicción que habían presentado. No sabíamos que esos 75 minutos estimados acabarían siendo más de 3 horas.

Nos hicimos algunas preguntas clave: ¿Cuáles eran nuestros objetivos? ¿Qué queríamos hacer en un principio? ¿Qué se había podido implementar dadas las limitaciones? Y, por supuesto, ¿qué habíamos aprendido?

Esta fue la parte más enriquecedora de la experiencia. He participado en otros concursos de datos, pero siempre me he mantenido fiel a mi forma de resolver los problemas y a mi propia experiencia. En esta ocasión, pudimos compartir nuestras experiencias y, por lo tanto, ampliar nuestras mentes.

Algunos de los principales aprendizajes que surgieron de nuestra transferencia de conocimientos fueron:

  • La ingeniería de funciones es insuperable a la hora de mejorar su modelo.
  • Tener una configuración rápida ayuda... mucho.
  • El momento de la presentación por primera vez es crucial.
  • Una gran parte de la partitura está orientada a la comunicación. Ser capaz de explicar y transmitir lo que haces y por qué. Es crucial tratar de contar una historia que guíe al lector a través de tus ideas, asumiendo lo menos posible sus conocimientos. (PD: esta narración fue lo que me dio el primer lugar)
  • Un TTFS bajo mejora la moral, te da una base de referencia y te motiva a mejorar tu puntuación.
  • ¡Tener gente a tu alrededor participando en la misma competencia es alentador! Permite realizar revisiones internas, intercambiar y recibir preguntas y reunir a personas con diferentes antecedentes y conocimientos. Una competitividad saludable impulsa la mejora.

4) Propiedad

Crear y mantener espacios de aprendizaje de esta naturaleza requiere más que buenas intenciones. El cuidado y el impulso constantes son necesarios para prosperar. Alguien tiene que dar un paso adelante, asumir la responsabilidad y comunicar los puntos de acción y los próximos pasos.

Resultados

¡Los tres primeros lugares fueron para Mutt Data! Pero no nos detuvimos ahí. Nuestro equipo también ganó el séptimo y el undécimo lugar.

Estábamos ansiosos por ver si los puestos se mantendrían después de la evaluación final del jurado para entender si otros enfoques habían sido mejores y por qué. Los resultados se mantuvieron y los comentarios recibidos durante el evento fueron excelentes.

¡Terminando!

Esta competencia de datos nos ha dejado muchos aprendizajes que esperamos aplicar. Nuestro equipo ya está participando en un concurso de visión artificial. Planeamos continuar expandiendo este espacio para aprender, conocernos y divertirnos.

En cuanto a los detalles técnicos, estad atentos para ver más publicaciones de esta serie en el futuro.

¡Estamos contratando!

Esperamos que esta publicación te haya resultado útil y, al menos, entretenida. Si te ha gustado lo que has leído hasta ahora, tienes unas increíbles habilidades de desarrollo y te gusta aplicar el aprendizaje automático para resolver desafíos empresariales difíciles, visita nuestra cuenta de Lever para ofertas de trabajo actuales!

Share article.
News & insights

Latest Insights

Muttdata
Empresa

¿Cómo sabes que es hora de hacer evolucionar tu marca?

Evolucionar nuestra marca para que esté a la altura de nuestro crecimiento
Read Article
Modern Data Platform

El lenguaje natural se une a los datos en tiempo real: análisis sin cuellos de botella

Obtenga información sin necesidad de conocimientos técnicos
Read Article
Paid Media Optimizer

No todos los optimizadores de medios de pago están diseñados de la misma manera

5 razones por las que deberías solicitar una demo
Read Article

Listo para desbloquear

¿el poder de los datos?