La elección tecnológica que alimenta al gigante Despegar

“La capacidad de tener una organización data driven (impulsada por datos) no depende de comprar la herramienta adecuada sino de tener un equipo que tenga las capacidades necesarias para obtener información de los datos, plantear experimentos y analizar resultados”, dijo Carlos Álvarez, CTO de la empresa de viajes online

Por Laura Pantoja – lpantoja@comercioyjusticia.info

Recientemente, Despegar, agencia de viajes online, anunció la apertura de una nueva oficina en el país, esta vez en la ciudad de Córdoba. Se trata de su quinta oficina; ya tiene puntos en Buenos Aires y otro en La Plata, y significa la creación de un nuevo espacio para el desarrollo del talento argentino con una proyección de cien ingenieros de software y product managers a fin del año próximo.
Como se sabe, es la empresa de viajes online líder en Latinoamérica. Opera en 20 países y brinda una oferta amplia de productos de viaje, incluyendo vuelos, paquetes de viaje, alojamientos y otros productos relacionados con el turismo a más de 17 millones de clientes.
A través de su sitio web o de su aplicación móvil ofrece productos de más de 300 aerolíneas, más de 450.000 opciones de alojamiento, aproximadamente mil agencias de alquiler de vehículos y aproximadamente 240 proveedores de servicios en destino con más de 7.700 actividades en toda Latinoamérica.
En función de su ilimitado crecimiento, Comercio y Justicia quiso conocer su estrategia tecnológica para poder sostenerlo y para ello entrevistó a Carlos Álvarez, CTO de Despegar.

– En función del crecimiento de Despegar en el país, ¿cuál es la plataforma tecnológica que lo sostiene?
La plataforma tecnológica de Despegar es fundamentalmente de código abierto, con fuerte presencia de una máquina virtual Java de proceso nativo, ejecutable en una plataforma específica, capaz de interpretar y ejecutar instrucciones expresadas en un código binario especial.
El uso de una plataforma de cloud híbrida (pública y privada) nos permite acomodar picos de demanda y necesidades puntuales de escalabilidad. Por otra parte, en la gestión de datos usamos las herramientas Cassandra y MariaDB y para requerimientos de big data y otras para el procesamiento de eventos con volumen. Las aplicaciones que conforman Despegar son desarrolladas in house por nuestro equipo de ingeniería.

¿Cuáles han sido las renovaciones en materia de herramientas tecnológicas para soportar el crecimiento?
Estamos continuamente renovando nuestras herramientas tecnológicas. Nuestro equipo de ingeniería se encuentra constantemente desarrollando herramientas innovadoras para manejar el volumen de interacciones en nuestra plataforma, acercar nuevos canales de relacionamiento y entregar una oferta cada vez más completa y personalizada.
Nuestra plataforma ha experimentado muchos cambios durante los últimos años como la adopción de plataformas open source, arquitectura orientada a microservicios, aplicaciones stateless (que no registra datos generados en una sesión) y cloud para aumentar la escalabilidad y confiabilidad de la plataforma.
También se han incorporado herramientas de big data para procesar el gran volumen de datos de todos los eventos que nuestra plataforma genera y se han adoptado diversas bases de datos, además de las relacionales, para resolver problemas específicos.

¿Cómo desarrollan la inteligencia de negocios? ¿con qué software?
Nuestro lago de datos está basado en herramientas open source. Nuestro equipo de análisis de datos procesan información usando Spark (gestor de grandes volúmenes de datos) para analizar datos. Usamos algunas herramientas comerciales para presentación de datos, pero -en definitiva- no cumplen un papel central en el análisis de datos que se basa en Spark, Python y bibliotecas de código abierto. Los equipos que necesitan trabajar con datos para tomar decisiones o diseñar experimentos extraen los datos del lago de datos y explorarlos usando las herramientas de referencia. Tenemos una iniciativa permanente -la “escuelita” data scientist o de científico de datos, de formación de los equipos ( comerciales, operaciones, customer care) para que todos los integrantes tengan la capacidad de usar herramientas de exploración y análisis estadístico de datos.

¿Cómo funcionan los analytics y qué toma de decisiones se han concretado en virtud de sus resultados?
Por un lado, el trackeo de todas las actividades de nuestros usuarios nos permite conocer sus patrones de navegación y preferencias. Tener registro de cualquier interacción con nuestra plataforma de cualquiera de nuestros usuarios requiere desarrollos con fuerte foco en la escalabilidad y manejo de enormes volúmenes de información. Toda esa información se almacena en diferentes sistemas (de factura interna, y los mencionados anteriormente basados en Cassandra, HDFS y MariaDB ) para luego ser accedida por nuestros equipos de análisis de datos. Prácticamente todas las decisiones que afectan a la experiencia de nuestros usuarios se toman analizando estos datos: diseño de nuestro site, direccionamiento de nuestros esfuerzos para obtener acuerdos comerciales, detección de comportamientos maliciosos en el site.

Por ejemplo, ¿cuál han sido resultados concretos de sus procesos de análisis?
El diseño de interacción de nuestro site responde a resultados de análisis de comportamiento. Además, detectamos los cambios en la demanda que se evidencian por cambios en el comportamiento de nuestros usuarios para adecuar la oferta al interés que los usuarios manifiestan. Por otra parte, la protección frente a transacciones maliciosas se basa en procesos de exploración de datos.

¿Hacia dónde estará orientada la inversión en tecnología durante los próximos años?
En los próximos años seguiremos reforzando nuestra capacidad de análisis de datos, mejorando las herramientas y continuando con la capacitación permanente a nuestro equipo. En nuestra visión, la capacidad de tener una organización data driven (impulsada por datos) no depende de comprar la herramienta adecuada, sino de tener un equipo que tenga las capacidades necesarias para obtener información de los datos (muchas veces esto es formación en machine learning o aprendizaje automático, estadística matemática), plantear experimentos y analizar resultados. Otra área donde seguiremos invirtiendo fuertemente en el desarrollo de nuestras herramientas es en machine learning / inteligencia artificial.
El objetivo de la inteligencia artificial es seguir mejorando la experiencia de los usuarios, ayudándolos a encontrar aquellos productos que sean relevantes para sus gustos, intereses y necesidades.
Dado los enormes volúmenes de las ofertas actuales es muy difícil encontrar algo sin la ayuda de la búsqueda inteligente que pueda buscar por uno y ofrecer recomendaciones personalizadas, adelantar problemas que pudieran surgir como demoras y cancelaciones y ayudar en su resolución, así como también brindar más seguridad en las transacciones.

Artículos destacados